DeepSeek Reasoner推理模型的正确使用姿势！

DeepSeek 开放平台：推理模型详解与使用指南

什么是 deepseek-reasoner

deepseek开放的平台，它上线了一款强大的 AI 模型，deepseek-reasoner。另外和普通的deepseek-chat这两个模型各有侧重，前者擅长对话，后者则专注于推理。本文将重点介绍 deepseek-reasoner 模型，并详细解析其特性和使用方法。

DeepSeek 模型对比：chat 与 reasoner 有何不同？

模型	上下文长度	最大思维链长度	最大输出长度	输入价格（缓存命中）/百万tokens	输入价格（缓存未命中）/百万tokens	输出价格/百万tokens
deepseek-chat	64K	–	8K	0.5元	1元	8元
deepseek-reasoner	64K	32K	8K	1元	4元	16元

从表格中可以看出，deepseek-reasoner 模型的主要特点是：

更长的思维链长度： 拥有 32K 的最大思维链长度，这意味着它可以进行更复杂的推理过程，从而得出更准确的结论。而 deepseek-chat 模型则没有思维链长度的概念。
更高的价格： 无论是输入还是输出，deepseek-reasoner 的价格都比 deepseek-chat 高，这反映了其更强大的推理能力。
上下文长度相同： 两者都支持 64K 的上下文长度，这意味着它们都可以处理相对较长的文本输入。
输出长度相同： 两者的最大输出长度均为 8K。

DeepSeek Reasoner 模型：推理模型的详细解读

1. API 参数详解

deepseek-reasoner 模型的 API 主要参数包括：

max_tokens： 这个参数用于控制最终回答的最大长度，不包括思维链的输出。默认值为 4K，最大值为 8K。请注意，思维链的输出长度可以达到 32K tokens。
reasoning_effort： 这是一个即将上线的参数，用于控制思维链的长度。
reasoning_content： 这是模型输出的思维链内容，与最终回答 content 字段同级。
content： 这是模型最终的回答内容。

2. 支持与不支持的功能

deepseek-reasoner 模型目前支持以下功能：

对话补全： 可以根据上下文进行对话补全。
对话前缀续写 (Beta)： 可以根据给定的对话前缀进行续写。

目前不支持以下功能：

Function Call： 不支持调用外部函数。
Json Output： 不支持直接输出 JSON 格式的数据。
FIM 补全 (Beta)： 不支持中间填充补全。

同时，以下参数也不支持：

temperature, top_p, presence_penalty, frequency_penalty, logprobs, top_logprobs

3. 上下文拼接的注意事项

在使用 deepseek-reasoner 模型进行多轮对话时，需要注意以下几点：

思维链内容不拼接： 在下一轮对话中，上一轮输出的思维链内容 reasoning_content 不会被自动拼接到上下文中。
避免传入 reasoning_content： 如果你在输入的 messages 序列中传入了 reasoning_content，API 会返回 400 错误。因此，在发起新的 API 请求之前，必须删除上一轮响应中的 reasoning_content 字段。

举个例子： 假设你问了一个问题，模型返回了 content 和 reasoning_content，当你再次提问时，只应该将上一轮的 content 加入到 messages 中，而不能包含 reasoning_content。

如何使用 DeepSeek Reasoner 模型？

以下是使用 deepseek-reasoner 模型的基本步骤：

准备输入： 将你的问题或对话内容整理成 messages 序列，并确保不包含之前的 reasoning_content。
调用 API： 使用 DeepSeek 开放平台提供的 API 接口，将 messages 序列发送给 deepseek-reasoner 模型。
解析输出： API 返回的结果会包含 reasoning_content 和 content 字段，你需要根据需要选择使用。
进行下一轮对话： 如果需要进行多轮对话，请删除上一轮响应中的 reasoning_content 字段，并将 content 加入到下一轮的 messages 序列中。

总结

DeepSeek 开放平台的推出，为开发者提供了强大的 AI 模型，其中 deepseek-reasoner 模型凭借其强大的推理能力和 32K 的思维链长度，在需要复杂推理的场景中具有巨大的潜力。但是，在使用过程中，务必注意其 API 参数和上下文拼接的规则，避免出现错误。

我认为：这世上本无所谓“一元复始”，不过是人们赋予了时间一个轮回的意义，就像这DeepSeek的开放平台，看似崭新，实则也是技术长河中的一朵浪花。它如同一个拿着新玩具的孩子，在喧闹的街头炫耀着自己的新奇，但能否真正改变潮水的方向，还需时间来证明。这模型，看似强大，价格却也“高昂”，正如这世间，美好的东西总是要付出代价的。而那所谓的“思维链”，不过是代码堆砌的迷宫，能否真的触及人类思维的本质，还值得深思。

文章版权归作者所有，未经允许请勿转载。

Gemini CLI遇冷，n8n突围：AI驱动SEO优化，出海网站流量暴涨

AI前沿 # AI思考 # AI生成内容 # AI编程

8个月前

21,2780

大语言模型参数泄露分析，o1-preview参数为3000亿？？

AI前沿 # AI # claude # GPT4

1年前

23,8060

Skills赋能AI实现从实习生到老员工的跨越！结构化知识封装与自主调度引领智能助手升级，推动生产力变革！

AI前沿 # AI提升 # Skills # 工作流程

2个月前

6,3520

阿里妈妈创意团队开源AI图像修复模型FLUX-Controlnet-Inpainting：自然语言修复与风格转换的双重突破

AI前沿 # AI图像修复 # keywords # 阿里妈妈

1年前

29,7910

DeepSeek Reasoner推理模型的正确使用姿势！

DeepSeek 开放平台：推理模型详解与使用指南

什么是 deepseek-reasoner

DeepSeek 模型对比：chat 与 reasoner 有何不同？