DeepSeek-R1重磅开源！性能对标OpenAI，模型蒸馏、MIT协议，引领AI新潮流

DeepSeek-R1 正式发布：开源模型权重、API 服务及技术详解

DeepSeek-R1 是什么？为何如此重要？

DeepSeek-R1 是由 DeepSeek 公司正式发布的大型语言模型，并同步开源了模型权重。它遵循 MIT License，允许用户使用 蒸馏技术 基于 R1 训练其他模型，这极大地促进了技术的共享和发展。DeepSeek-R1 还上线了 API 服务，用户可以通过设置 model='deepseek-reasoner' 来调用，体验其强大的思维链输出能力。

DeepSeek-R1 的核心亮点有哪些？

性能对标 OpenAI-o1: DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在极少标注数据的情况下，推理能力大幅提升，在数学、代码、自然语言推理等任务上，性能媲美 OpenAI o1 正式版。
技术完全公开: DeepSeek 公司公开了 DeepSeek-R1 的全部训练技术，旨在促进技术社区的充分交流和创新协作。
模型蒸馏: 通过 DeepSeek-R1 的输出，DeepSeek 公司还蒸馏了多个小模型并开源，其中 32B 和 70B 模型在多项能力上达到了 OpenAI o1-mini 的水平。

如何使用 DeepSeek-R1 模型？

如何调用 DeepSeek-R1 API？

用户可以通过 DeepSeek API 调用 DeepSeek-R1 模型，进行各种推理任务。

设置模型参数: 在代码中，将 model 参数设置为 'deepseek-reasoner'，即可调用 DeepSeek-R1 模型。
API 调用价格: DeepSeek-R1 API 服务的定价为：每百万输入 tokens 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 tokens 16 元。
详细调用指南: 有关 API 调用的详细指南，请参考官方文档：https://api-docs.deepseek.com/zh-cn/guides/reasoning_model。

如何通过 DeepSeek 官网或 App 使用？

登录: 打开 DeepSeek 官网或官方 App。
开启“深度思考”模式: 找到并打开 “深度思考” 模式。
体验推理能力: 即可调用最新版的 DeepSeek-R1 完成各类推理任务，感受其强大的思维链输出能力。

DeepSeek-R1 的开源协议和使用政策？

为什么 DeepSeek-R1 选择 MIT License？

为了推动开源社区及行业生态的发展，DeepSeek 在发布并开源 R1 的同时，对协议授权层面进行了调整：

统一使用 MIT License: DeepSeek 放弃了之前使用的 DeepSeek License，转而采用更标准化、宽松的 MIT License。
完全开源，不限制商用: 使用 MIT License，模型权重完全开源，不限制商业用途，开发者无需申请即可直接使用。
支持模型蒸馏: DeepSeek 更新了线上产品的用户协议，明确允许用户通过模型蒸馏等方式，利用模型输出训练其他模型，这对于促进技术共享和创新具有重要意义。

什么是模型蒸馏，为什么 DeepSeek 支持？

模型蒸馏 是一种将大型模型（如 DeepSeek-R1）的知识迁移到小型模型的方法。DeepSeek 支持模型蒸馏，这意味着你可以利用 DeepSeek-R1 的输出作为训练数据，来训练自己的小模型，这相当于“站在巨人的肩膀上”，可以让你的模型快速达到更高的水平。例如，你可以使用 DeepSeek-R1 的输出作为“老师”，来教你的小模型，让小模型也能学会 DeepSeek-R1 的推理能力。

DeepSeek-R1 的技术细节有哪些？

DeepSeek-R1 如何实现性能提升？

DeepSeek-R1 之所以能够在推理能力上比肩 OpenAI o1 正式版，关键在于其采用了以下技术：

大规模强化学习: 在后训练阶段，DeepSeek-R1 大规模使用了强化学习技术，大幅提升了模型的推理能力。
极少标注数据: 即使在只有少量标注数据的情况下，DeepSeek-R1 也能达到优秀的性能，这意味着其学习能力非常强大。
思维链输出: DeepSeek-R1 具有强大的思维链输出能力，这使得它在复杂推理任务中表现突出，能够像人类一样进行思考和推导。

总结

DeepSeek-R1 的发布和开源，不仅为开发者提供了强大的模型工具，也为整个 AI 领域的发展注入了新的活力。其开源、宽松的 MIT License，以及对模型蒸馏的支持，都体现了 DeepSeek 公司推动技术共享、促进创新协作的决心。无论是开发者、研究者还是普通用户，都可以从中受益，共同探索 AI 的无限可能。

我认为：DeepSeek-R1的发布，像一声春雷，震响了开源界，它以开放的姿态，将技术毫无保留地分享给每一位开发者，这无疑是对传统封闭模式的一次有力挑战。它就像一盏明灯，照亮了技术共享的道路，让我们可以站在巨人的肩膀上，看得更远，走得更快。这种大气的举动，让我们看到了AI技术不再是少数人独享的特权，而是可以惠及全人类的宝贵资源。然而，我们也要警惕一些别有用心的人，可能会利用开源的技术进行不当的行为，因此，我们更应该在享用技术便利的同时，遵守道德底线，共同维护一个健康、有序的开源环境。