DeepSeek-R1:强化学习突破,首个Nature同行评审大模型,推理技术揭秘 DeepSeek-R1:首个通过Nature同行评审的大语言模型,推理能力背后的技术揭秘 ## 1. 为什么DeepSeek-R1能够登上Nature封面? DeepSeek-R1的研究成果,即《De... AI前沿# AI# deepseek# Nature 3个月前19,7050
Kimi K2模型:代码能力突破,开源模型新SOTA,加速通用Agent落地 Kimi K2 模型发布:更强代码能力与通用 Agent 任务 什么是 Kimi K2 模型?#KimiK2,#大模型,#开源模型 Kimi K2 是一款由 Moonshot AI 推出的新型基础模型... AI前沿# 3D场景# Agent# AgenticToolUse 5个月前14,3290
Kimi深度研究:RL赋能AI Agent,信息洞察新方式? Kimi深度研究:强化学习赋能的AI Agent,洞察信息新方式? 1. 什么是Kimi深度研究? 1.1 深度研究的起源与发展 深度研究并非简单的问答,而是一个完整的调查过程。 最早由OpenAI在... AI前沿# Agent# AI# keywords 5个月前12,2250
DeepResearcher:强化学习加持,真实网络环境训练,AI研究模型新突破 好的,收到你的指令。我将以专业的文案编辑助手身份,对你提供的内容进行整理、润色和补充,使其成为一篇逻辑清晰、结构合理、内容丰富的文章。以下是根据你的要求生成的 Markdown 代码块格式的回复: D... AI前言# AI# AI研究模型# DeepResearcher 6个月前13,6230
AI Agent破局:经验学习崛起,迎接AGI新时代! 走向AGI:AI Agent 如何迎来以经验学习为主导的新时代? 什么是 AI Agent 的范式转变? {#AI-Agent-范式转变} AI 正在迎来一个以经验学习为主导的新时代。这意味着 AI ... AI前言# Agent# AGI# AI 8个月前12,1570
人形机器人半马:AI下半场开启,实践出真知,中国制造崛起 为什么说人形机器人半马开启了AI的下半场? 什么是人形机器人半程马拉松? 全球首场人形机器人半程马拉松于4月19日在北京亦庄开跑,吸引了20支机器人赛队和12000名人类选手。这场约21公里的赛事,对... AI前言# AI# 中国制造# 人工智能 8个月前13,0310
Anthropic CEO 透露:未来3-6个月将推出GPT-5级别新模型,强化学习引领AI推理 Anthropic CEO Dario 透露未来 3-6 个月将推出全新模型 Anthropic 的新模型将如何区别于现有的推理模型? 在最近的一次 WSJ 采访中,Anthropic CEO Dar... AI前沿# Anthropic# 强化学习# 推理模型 11个月前25,2910
DeepSeek-R1:一家非美公司的开源壮举,挑战AI发展格局 为什么说DeepSeek-R1的出现“毫无意义”? 我们正处在一个有趣的时代,一家非美国公司 DeepSeek 正在以一种出人意料的方式,践行着 OpenAI 最初的使命:推动真正开放、前沿的人工智能... AI前沿# AlphaZero# deepseek# GRPO 11个月前49,8560
DeepSeek-R1重磅开源!性能对标OpenAI,模型蒸馏、MIT协议,引领AI新潮流 DeepSeek-R1 正式发布:开源模型权重、API 服务及技术详解 DeepSeek-R1 是什么?为何如此重要? DeepSeek-R1 是由 DeepSeek 公司正式发布的大型语言模型,并同... AI前沿# MITLicense# 大型语言模型# 开源模型 11个月前17,6640
WebRL框架如何通过强化学习革命性提升LLMs网页智能体能力? 🌐 自我进化框架WebRL如何增强LLMs网页智能体? 大型语言模型(LLMs)一直在语言理解、常识推理和知识获取方面展现出卓越的能力。它们同样具备在复杂规划与逻辑推理的潜力。近年来,以LLMs为驱动... AI前沿# LLM# 强化学习 1年前20,3110