大模型突破:General Reasoning,开放推理平台,助力AI“理解”飞跃

AI前沿3周前发布 yizz
2,165 0 0
广告也精彩

开放推理平台 General Reasoning:助力大模型从“生成”到“理解”的飞跃

1. 为什么我们需要开放推理平台?——推理模型发展的新趋势

DeepseekGPT-o3 等模型的出现,标志着推理模型正在经历从单纯的“生成”到更深层次的“理解”和“推理”的重大转变。虽然已经涌现出许多优秀的开源推理模型,但高质量的训练数据依然是瓶颈。General Reasoning 应运而生,旨在通过提供海量的推理数据,助力开放模型迎头赶上甚至超越封闭模型。

2. 什么是 General Reasoning?——一个开放的推理数据平台

General Reasoning 是一个开放的推理平台,它允许任何人贡献问题和验证答案。它的核心目标是推动开放研究与封闭研究并驾齐驱。

2.1 General Reasoning 的亮点

  • 覆盖领域广阔:涵盖了数学、医学、化学等 10 大领域,包含超过 156 万个问题。
  • 提供思维链:包含 26.8 万条思维链,能够帮助模型进行更深度的推理训练。
  • 持续更新:平台将持续更新数据,覆盖竞赛、学术、工程等多种场景。
  • 开源引擎:提供开源引擎生成推理数据。
  • 社区平台:建立社区平台,方便用户提问题、写推理过程、验证答案。

3. 如何使用 General Reasoning?——获取数据的方式

General Reasoning 提供了两种主要的数据获取方式:

3.1 通过 Hugging Face 数据转储

你可以从 Hugging Face 下载预先准备好的数据转储文件:huggingface.co/generalreasoning

3.2 通过 API

你可以使用 API 来获取指定任务的数据。

步骤 1:获取 API 密钥

首先,你需要在 General Reasoning 平台上注册并获取你的 API 密钥(YOUR_API_KEY)。

步骤 2:安装 AGI 客户端

使用 pip 安装 agi 客户端:
bash
pip install agi

步骤 3:使用 API 获取数据

以下代码展示了如何使用 API 获取医学考试 (medical-exams) 任务中,Deepseek-R1 模型的数据:

python
import agi

client = agi.Client(“YOUR_API_KEY”)

下载推理过程和验证数据,保存为 .jsonl 文件

client.data.get(task=’medical-exams’, model=’Deepseek-R1′)

这段代码会下载 Deepseek-R1 在医学考试任务上的推理过程和验证数据,并将结果保存为一个 JSON Lines 文件。

3.3 医学问题示例

以下展示了一个医学问题的示例,以及 Deepseek-R1 模型的验证过程:

  • 问题 (Q):调节脂肪生成的最重要的酶是什么?
  • 答案 (A):乙酰辅酶 A 羧化酶。
  • R1 验证:调节脂肪生成的最重要酶是乙酰辅酶 A 羧化酶 (ACC)。原因如下:

    • 限速作用:ACC 催化乙酰辅酶 A 转化为丙二酰辅酶 A,这是脂肪酸合成中的限速步骤。该反应使乙酰辅酶 A(源自碳水化合物)参与脂肪生成,使 ACC 成为关键的调节检查点。
    • 荷尔蒙调节:胰岛素通过去磷酸化激活 ACC,促进高能量状态下(例如进食后)的脂肪生成。胰高血糖素和肾上腺素通过磷酸化抑制 ACC,从而减少禁食或压力期间的脂肪酸合成。
    • 能量感应控制:当细胞能量低(AMP/ADP 高)时,AMP 活化蛋白激酶 (AMPK) 会磷酸化并灭活 ACC,从而停止脂肪生成以节省资源。
    • 双重代谢作用:丙二酰辅酶 A(ACC 的产品)不仅能促进脂肪酸合成酶 (FAS) 的脂肪酸延长,还能抑制肉碱棕榈酰转移酶 1 (CPT1),阻止脂肪酸氧化。这种双重功能确保脂肪合成和分解相互调节。

    虽然其他酶(例如 FAS、ATP-柠檬酸裂解酶)也参与脂肪生成,但 ACC 因其位于代码生成

错误纠正:原文中 “GBT” 应为 “GPT”。

4. Global Leaderboard:评估大模型性能的平台

Global Leaderboard 使用一个私有测试集来评估市面上各大模型在不同任务上的表现。排行榜会不断更新,加入新的测试题,方便研究者了解模型的最新进展。

4.1 当前排行榜的表现

根据 2023 年 2 月份的数据,DS-R1 在所有任务上的平均准确率排名第一,而 O3 在医学任务上表现突出,准确率排名第一。

5. 更多领域问题及数据

更多领域的问题和数据可以在 General Reasoning 官网查阅:https://gr.inc/?continueFlag=09a3f57f9e41aef5513ffea9e6ce1c8d

6. 其他推荐内容

  • 多模态大模型:OmniVision-968M:最紧凑、最小的边缘 AI 多模态视觉语言模型。
  • AI 智能体:Smolagents:支持工具调用、代码执行,只需三行代码即可搞定。
  • 文档解析工具:IBM 开源一站式文档解析工具,轻松解析 PDF、PPT、图片及网页,是从 PDF 中解析数据的最佳工具。
  • LLM 大模型数据基础:构建 LLM 大模型的数据基础。

我认为:

开放数据是推动人工智能发展的关键。General Reasoning 这样的平台,就像黑暗中的一盏明灯,照亮了开源研究的前进方向。数据鸿沟不应成为阻碍创新的壁垒,而应化为激励我们共同前进的动力。沉默呵?沉默呵!不在沉默中爆发,就在沉默中灭亡……而 General Reasoning,正是那一声打破沉默的呐喊! , , ,

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!