DeepSeek R1升级:深度思考进化,幻觉率降低,API功能增强

AI前言1天前发布 yizz
1,107 0 0
广告也精彩

好的,请您提供原文内容,我将按照您提出的要求进行整理和编辑,生成一篇逻辑清晰、步骤详细、结构合理的文章。

DeepSeek R1 模型迎来重大升级:深度思考能力显著提升

1. DeepSeek R1-0528 版本带来了哪些关键更新?

DeepSeek R1 模型迎来了小版本升级,当前版本为 DeepSeek-R1-0528。主要更新集中在以下几个方面:

  • 深度思考能力强化: 通过投入更多算力进行后训练,显著提升了模型的思维深度和推理能力。
  • 基准测评表现优异: 在数学、编程和通用逻辑等多个基准测评中取得了国内领先的成绩,整体表现接近国际顶尖模型。
  • 幻觉改善: 针对“幻觉”问题进行了优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50%。
  • 创意写作能力提升: 针对议论文、小说、散文等文体进行了优化,能够输出更长、结构更完整的长篇作品,并呈现更贴近人类偏好的写作风格。
  • 工具调用支持DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用),Tau-Bench 测评成绩与 OpenAI o1-high 相当。
  • API 更新: API 同步更新,接口与调用方式保持不变,增加了 Function Calling 和 JsonOutput 的支持,并调整了 max_tokens 参数的含义。

2. DeepSeek-R1-0528 如何提升了深度思考能力?

DeepSeek-R1-0528 仍然使用 2024 年 12 月发布的 DeepSeek V3 Base 模型作为基座,但通过在后训练过程中投入更多算力,实现了思维深度和推理能力的显著提升。

  • 更深入的推理过程: 在 AIME 2025 测试中,新版模型的准确率从旧版的 70% 提升至 87.5%。旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。
  • 思维链蒸馏: 通过蒸馏 DeepSeek-R1-0528 的思维链后训练 Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。该 8B 模型在数学测试 AIME 2024 中表现出色,仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。

3. DeepSeek-R1-0528 在哪些方面进行了优化,以减少“幻觉”?

新版 DeepSeek R1 针对“幻觉”问题进行了优化,主要体现在以下几个方面:

  • 降低幻觉率: 在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右。这意味着模型能够提供更准确、可靠的结果。
  • 更可靠的输出: 通过优化训练数据和算法,模型在生成内容时更加注重事实性和逻辑性,从而减少了“幻觉”的产生。

4. 如何使用 DeepSeek-R1-0528 的 API?

DeepSeek-R1-0528 的 API 已经同步更新,接口与调用方式保持不变。

  • API 功能增强: 新版 API 增加了 Function Calling 和 JsonOutput 的支持。
  • max_tokens 参数调整max_tokens 用于限制模型单次输出的总长度(包括思考过程),默认为 32K,最大为 64K。请 API 用户及时调整 max_tokens 参数以防输出被提前截断。
  • API 指南: 详细的使用方法请参考 API 指南:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

5. DeepSeek-R1-0528 的模型是如何开源的?

DeepSeek-R1-0528 与之前的 DeepSeek-R1 使用同样的 base 模型,仅改进了后训练方法。

  • 私有化部署: 私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。
  • 模型参数: 模型参数为 685B(其中 14B 为 MTP 层),开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。
  • 模型权重下载
  • 开源协议: 开源仓库(包括模型权重)仍然统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

6. 如何体验DeepSeek R1-0528?

用户可以通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本,赶紧去试试吧!

我认为:DeepSeek 此次 R1 模型的升级,不仅仅是技术上的进步,更是对人工智能深度思考能力的一次深刻探索。在AI大模型同质化严重的今天,DeepSeek 能够沉下心来,专注于提升模型的思维深度和推理能力,这种精益求精的精神值得我们学习。但,路漫漫其修远兮,AI的未来,还需吾辈共同求索!

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!