DeepSeek 开放平台:推理模型详解与使用指南
什么是 deepseek-reasoner
deepseek开放的平台,它上线了一款强大的 AI 模型,deepseek-reasoner。另外和普通的deepseek-chat这两个模型各有侧重,前者擅长对话,后者则专注于推理。本文将重点介绍 deepseek-reasoner 模型,并详细解析其特性和使用方法。
DeepSeek 模型对比:chat 与 reasoner 有何不同?
模型 | 上下文长度 | 最大思维链长度 | 最大输出长度 | 输入价格(缓存命中)/百万tokens | 输入价格(缓存未命中)/百万tokens | 输出价格/百万tokens |
---|---|---|---|---|---|---|
deepseek-chat | 64K | – | 8K | 0.5元 | 1元 | 8元 |
deepseek-reasoner | 64K | 32K | 8K | 1元 | 4元 | 16元 |
从表格中可以看出,deepseek-reasoner 模型的主要特点是:
- 更长的思维链长度: 拥有 32K 的最大思维链长度,这意味着它可以进行更复杂的推理过程,从而得出更准确的结论。而 deepseek-chat 模型则没有思维链长度的概念。
- 更高的价格: 无论是输入还是输出,deepseek-reasoner 的价格都比 deepseek-chat 高,这反映了其更强大的推理能力。
- 上下文长度相同: 两者都支持 64K 的上下文长度,这意味着它们都可以处理相对较长的文本输入。
- 输出长度相同: 两者的最大输出长度均为 8K。
DeepSeek Reasoner 模型:推理模型的详细解读
1. API 参数详解
deepseek-reasoner 模型的 API 主要参数包括:
- max_tokens: 这个参数用于控制最终回答的最大长度,不包括思维链的输出。默认值为 4K,最大值为 8K。请注意,思维链的输出长度可以达到 32K tokens。
- reasoning_effort: 这是一个即将上线的参数,用于控制思维链的长度。
- reasoning_content: 这是模型输出的思维链内容,与最终回答 content 字段同级。
- content: 这是模型最终的回答内容。
2. 支持与不支持的功能
deepseek-reasoner 模型目前支持以下功能:
- 对话补全: 可以根据上下文进行对话补全。
- 对话前缀续写 (Beta): 可以根据给定的对话前缀进行续写。
目前不支持以下功能:
- Function Call: 不支持调用外部函数。
- Json Output: 不支持直接输出 JSON 格式的数据。
- FIM 补全 (Beta): 不支持中间填充补全。
同时,以下参数也不支持:
- temperature, top_p, presence_penalty, frequency_penalty, logprobs, top_logprobs
3. 上下文拼接的注意事项
在使用 deepseek-reasoner 模型进行多轮对话时,需要注意以下几点:
- 思维链内容不拼接: 在下一轮对话中,上一轮输出的思维链内容 reasoning_content 不会被自动拼接到上下文中。
- 避免传入 reasoning_content: 如果你在输入的 messages 序列中传入了 reasoning_content,API 会返回 400 错误。因此,在发起新的 API 请求之前,必须删除上一轮响应中的 reasoning_content 字段。
举个例子: 假设你问了一个问题,模型返回了 content 和 reasoning_content,当你再次提问时,只应该将上一轮的 content 加入到 messages 中,而不能包含 reasoning_content。
如何使用 DeepSeek Reasoner 模型?
以下是使用 deepseek-reasoner 模型的基本步骤:
- 准备输入: 将你的问题或对话内容整理成 messages 序列,并确保不包含之前的 reasoning_content。
- 调用 API: 使用 DeepSeek 开放平台提供的 API 接口,将 messages 序列发送给 deepseek-reasoner 模型。
- 解析输出: API 返回的结果会包含 reasoning_content 和 content 字段,你需要根据需要选择使用。
- 进行下一轮对话: 如果需要进行多轮对话,请删除上一轮响应中的 reasoning_content 字段,并将 content 加入到下一轮的 messages 序列中。
总结
DeepSeek 开放平台 的推出,为开发者提供了强大的 AI 模型,其中 deepseek-reasoner 模型凭借其强大的推理能力和 32K 的思维链长度,在需要复杂推理的场景中具有巨大的潜力。但是,在使用过程中,务必注意其 API 参数和上下文拼接的规则,避免出现错误。
我认为:这世上本无所谓“一元复始”,不过是人们赋予了时间一个轮回的意义,就像这DeepSeek的开放平台,看似崭新,实则也是技术长河中的一朵浪花。它如同一个拿着新玩具的孩子,在喧闹的街头炫耀着自己的新奇,但能否真正改变潮水的方向,还需时间来证明。这模型,看似强大,价格却也“高昂”,正如这世间,美好的东西总是要付出代价的。而那所谓的“思维链”,不过是代码堆砌的迷宫,能否真的触及人类思维的本质,还值得深思。