DeepSeek Reasoner推理模型的正确使用姿势!

AI前沿3周前更新 yizz
92,217 0 0
广告也精彩

DeepSeek 开放平台:推理模型详解与使用指南

什么是 deepseek-reasoner

deepseek开放的平台,它上线了一款强大的 AI 模型deepseek-reasoner。另外和普通的deepseek-chat这两个模型各有侧重,前者擅长对话,后者则专注于推理。本文将重点介绍 deepseek-reasoner 模型,并详细解析其特性和使用方法。

DeepSeek 模型对比:chat 与 reasoner 有何不同?

模型 上下文长度 最大思维链长度 最大输出长度 输入价格(缓存命中)/百万tokens 输入价格(缓存未命中)/百万tokens 输出价格/百万tokens
deepseek-chat 64K 8K 0.5元 1元 8元
deepseek-reasoner 64K 32K 8K 1元 4元 16元

从表格中可以看出,deepseek-reasoner 模型的主要特点是:

  • 更长的思维链长度: 拥有 32K 的最大思维链长度,这意味着它可以进行更复杂的推理过程,从而得出更准确的结论。而 deepseek-chat 模型则没有思维链长度的概念。
  • 更高的价格: 无论是输入还是输出,deepseek-reasoner 的价格都比 deepseek-chat 高,这反映了其更强大的推理能力。
  • 上下文长度相同: 两者都支持 64K 的上下文长度,这意味着它们都可以处理相对较长的文本输入。
  • 输出长度相同: 两者的最大输出长度均为 8KDeepSeek Reasoner推理模型的正确使用姿势!

DeepSeek Reasoner 模型:推理模型的详细解读

1. API 参数详解

deepseek-reasoner 模型的 API 主要参数包括:

  • max_tokens: 这个参数用于控制最终回答的最大长度,不包括思维链的输出。默认值为 4K,最大值为 8K。请注意,思维链的输出长度可以达到 32K tokens。
  • reasoning_effort: 这是一个即将上线的参数,用于控制思维链的长度。
  • reasoning_content: 这是模型输出的思维链内容,与最终回答 content 字段同级。
  • content: 这是模型最终的回答内容。

2. 支持与不支持的功能

deepseek-reasoner 模型目前支持以下功能:

  • 对话补全: 可以根据上下文进行对话补全。
  • 对话前缀续写 (Beta): 可以根据给定的对话前缀进行续写。

目前不支持以下功能:

  • Function Call: 不支持调用外部函数。
  • Json Output: 不支持直接输出 JSON 格式的数据。
  • FIM 补全 (Beta): 不支持中间填充补全。

同时,以下参数也不支持:

  • temperature, top_p, presence_penalty, frequency_penalty, logprobs, top_logprobs

3. 上下文拼接的注意事项

在使用 deepseek-reasoner 模型进行多轮对话时,需要注意以下几点:

  • 思维链内容不拼接: 在下一轮对话中,上一轮输出的思维链内容 reasoning_content 不会被自动拼接到上下文中。
  • 避免传入 reasoning_content: 如果你在输入的 messages 序列中传入了 reasoning_content,API 会返回 400 错误。因此,在发起新的 API 请求之前,必须删除上一轮响应中的 reasoning_content 字段。

举个例子: 假设你问了一个问题,模型返回了 contentreasoning_content,当你再次提问时,只应该将上一轮的 content 加入到 messages 中,而不能包含 reasoning_content

如何使用 DeepSeek Reasoner 模型?

以下是使用 deepseek-reasoner 模型的基本步骤:

  1. 准备输入: 将你的问题或对话内容整理成 messages 序列,并确保不包含之前的 reasoning_content
  2. 调用 API: 使用 DeepSeek 开放平台提供的 API 接口,将 messages 序列发送给 deepseek-reasoner 模型。
  3. 解析输出: API 返回的结果会包含 reasoning_contentcontent 字段,你需要根据需要选择使用。
  4. 进行下一轮对话: 如果需要进行多轮对话,请删除上一轮响应中的 reasoning_content 字段,并将 content 加入到下一轮的 messages 序列中。

总结

DeepSeek 开放平台 的推出,为开发者提供了强大的 AI 模型,其中 deepseek-reasoner 模型凭借其强大的推理能力和 32K 的思维链长度,在需要复杂推理的场景中具有巨大的潜力。但是,在使用过程中,务必注意其 API 参数和上下文拼接的规则,避免出现错误。

我认为:这世上本无所谓“一元复始”,不过是人们赋予了时间一个轮回的意义,就像这DeepSeek的开放平台,看似崭新,实则也是技术长河中的一朵浪花。它如同一个拿着新玩具的孩子,在喧闹的街头炫耀着自己的新奇,但能否真正改变潮水的方向,还需时间来证明。这模型,看似强大,价格却也“高昂”,正如这世间,美好的东西总是要付出代价的。而那所谓的“思维链”,不过是代码堆砌的迷宫,能否真的触及人类思维的本质,还值得深思。

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!