DeepSeek R1升级：深度思考进化，幻觉率降低，API功能增强

AI前言1年前发布 yizz

17,977 0 0

好的，请您提供原文内容，我将按照您提出的要求进行整理和编辑，生成一篇逻辑清晰、步骤详细、结构合理的文章。

DeepSeek R1 模型迎来重大升级：深度思考能力显著提升

1. DeepSeek R1-0528 版本带来了哪些关键更新？

DeepSeek R1 模型迎来了小版本升级，当前版本为 DeepSeek-R1-0528。主要更新集中在以下几个方面：

深度思考能力强化：通过投入更多算力进行后训练，显著提升了模型的思维深度和推理能力。
基准测评表现优异：在数学、编程和通用逻辑等多个基准测评中取得了国内领先的成绩，整体表现接近国际顶尖模型。
幻觉改善：针对“幻觉”问题进行了优化，在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了 45～50%。
创意写作能力提升：针对议论文、小说、散文等文体进行了优化，能够输出更长、结构更完整的长篇作品，并呈现更贴近人类偏好的写作风格。
工具调用支持： DeepSeek-R1-0528 支持工具调用（不支持在 thinking 中进行工具调用），Tau-Bench 测评成绩与 OpenAI o1-high 相当。
API 更新： API 同步更新，接口与调用方式保持不变，增加了 Function Calling 和 JsonOutput 的支持，并调整了 max_tokens 参数的含义。

2. DeepSeek-R1-0528 如何提升了深度思考能力？

DeepSeek-R1-0528 仍然使用 2024 年 12 月发布的 DeepSeek V3 Base 模型作为基座，但通过在后训练过程中投入更多算力，实现了思维深度和推理能力的显著提升。

更深入的推理过程：在 AIME 2025 测试中，新版模型的准确率从旧版的 70% 提升至 87.5%。旧版模型平均每题使用 12K tokens，而新版模型平均每题使用 23K tokens，表明其在解题过程中进行了更为详尽和深入的思考。
思维链蒸馏：通过蒸馏 DeepSeek-R1-0528 的思维链后训练 Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。该 8B 模型在数学测试 AIME 2024 中表现出色，仅次于 DeepSeek-R1-0528，超越 Qwen3-8B (+10.0%)，与 Qwen3-235B 相当。

3. DeepSeek-R1-0528 在哪些方面进行了优化，以减少“幻觉”？

新版 DeepSeek R1 针对“幻觉”问题进行了优化，主要体现在以下几个方面：

降低幻觉率：在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了 45～50% 左右。这意味着模型能够提供更准确、可靠的结果。
更可靠的输出：通过优化训练数据和算法，模型在生成内容时更加注重事实性和逻辑性，从而减少了“幻觉”的产生。

4. 如何使用 DeepSeek-R1-0528 的 API？

DeepSeek-R1-0528 的 API 已经同步更新，接口与调用方式保持不变。

API 功能增强：新版 API 增加了 Function Calling 和 JsonOutput 的支持。
max_tokens 参数调整： max_tokens 用于限制模型单次输出的总长度（包括思考过程），默认为 32K，最大为 64K。请 API 用户及时调整 max_tokens 参数以防输出被提前截断。
API 指南：详细的使用方法请参考 API 指南：https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

5. DeepSeek-R1-0528 的模型是如何开源的？

DeepSeek-R1-0528 与之前的 DeepSeek-R1 使用同样的 base 模型，仅改进了后训练方法。

私有化部署：私有化部署时只需要更新 checkpoint 和 tokenizer_config.json（tool calls 相关变动）。
模型参数：模型参数为 685B（其中 14B 为 MTP 层），开源版本上下文长度为 128K（网页端、App 和 API 提供 64K 上下文）。
模型权重下载：
- Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528
- Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
开源协议：开源仓库（包括模型权重）仍然统一采用 MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

6. 如何体验DeepSeek R1-0528？

用户可以通过官方网站、APP 或小程序进入对话界面后，开启“深度思考”功能即可体验最新版本，赶紧去试试吧！

我认为：DeepSeek 此次 R1 模型的升级，不仅仅是技术上的进步，更是对人工智能深度思考能力的一次深刻探索。在AI大模型同质化严重的今天，DeepSeek 能够沉下心来，专注于提升模型的思维深度和推理能力，这种精益求精的精神值得我们学习。但，路漫漫其修远兮，AI的未来，还需吾辈共同求索！

文章版权归作者所有，未经允许请勿转载。

斯坦福大学统一多模态语言模型：The Language of Motion 解析

AI前沿 # 人工智能 # 人机交互 # 动作捕捉

2年前

29,3790

飞书+DeepSeek：几秒创作爆款文？| 公众号效率神器 | AI写作新纪元

AI前沿 # AI写作 # AI工作流 # AI绘图

1年前

33,3300

ComfyUI大更新：集成LLM+3D建模+视频生成，AI创作效率起飞！

AI前言 # 3D # 3D建模 # AI

1年前

32,2650

八大AI爆点：英伟达美图亚马逊，手把手教你笑着赚钱！

AI前言 # AI应用 # AI爆点 # 人工智能

1年前