学AI很简单-易之网
  • AI工具下载
  • AI绘画教程
    • SD入门教程
    • ComfyUI教程
  • AI项目教程
  • 免费镜像站
    • AI热门工具
    • AI办公工具
      • AI幻灯片和演示
      • AI表格数据处理
      • AI文档工具
      • AI思维导图
      • AI会议工具
      • AI效率提升
    • AI对话聊天
    • AI数字人
    • AI写作工具
    • AI图像工具
      • 常用AI图像工具
      • AI图片插画生成
      • AI图片背景移除
      • AI图片无损调整
      • AI图片优化修复
      • AI图片物体抹除
    • AI智能体
    • AI编程工具
    • AI视频工具
    • AI设计工具
    • AI音频工具

    强化学习

    共 12 篇文章
    排序
    发布更新浏览点赞
    DeepSeek-R1:强化学习突破,首个Nature同行评审大模型,推理技术揭秘

    DeepSeek-R1:强化学习突破,首个Nature同行评审大模型,推理技术揭秘

    DeepSeek-R1:首个通过Nature同行评审的大语言模型,推理能力背后的技术揭秘 ## 1. 为什么DeepSeek-R1能够登上Nature封面? DeepSeek-R1的研究成果,即《De...
    AI前沿# AI# deepseek# Nature
    3个月前
    19,7050
    Kimi K2模型:代码能力突破,开源模型新SOTA,加速通用Agent落地

    Kimi K2模型:代码能力突破,开源模型新SOTA,加速通用Agent落地

    Kimi K2 模型发布:更强代码能力与通用 Agent 任务 什么是 Kimi K2 模型?#KimiK2,#大模型,#开源模型 Kimi K2 是一款由 Moonshot AI 推出的新型基础模型...
    AI前沿# 3D场景# Agent# AgenticToolUse
    5个月前
    14,3290
    Kimi深度研究:RL赋能AI Agent,信息洞察新方式?

    Kimi深度研究:RL赋能AI Agent,信息洞察新方式?

    Kimi深度研究:强化学习赋能的AI Agent,洞察信息新方式? 1. 什么是Kimi深度研究? 1.1 深度研究的起源与发展 深度研究并非简单的问答,而是一个完整的调查过程。 最早由OpenAI在...
    AI前沿# Agent# AI# keywords
    5个月前
    12,2250
    DeepResearcher:强化学习加持,真实网络环境训练,AI研究模型新突破

    DeepResearcher:强化学习加持,真实网络环境训练,AI研究模型新突破

    好的,收到你的指令。我将以专业的文案编辑助手身份,对你提供的内容进行整理、润色和补充,使其成为一篇逻辑清晰、结构合理、内容丰富的文章。以下是根据你的要求生成的 Markdown 代码块格式的回复: D...
    AI前言# AI# AI研究模型# DeepResearcher
    6个月前
    13,6230
    AI Agent破局:经验学习崛起,迎接AGI新时代!

    AI Agent破局:经验学习崛起,迎接AGI新时代!

    走向AGI:AI Agent 如何迎来以经验学习为主导的新时代? 什么是 AI Agent 的范式转变? {#AI-Agent-范式转变} AI 正在迎来一个以经验学习为主导的新时代。这意味着 AI ...
    AI前言# Agent# AGI# AI
    8个月前
    12,1570
    人形机器人半马:AI下半场开启,实践出真知,中国制造崛起

    人形机器人半马:AI下半场开启,实践出真知,中国制造崛起

    为什么说人形机器人半马开启了AI的下半场? 什么是人形机器人半程马拉松? 全球首场人形机器人半程马拉松于4月19日在北京亦庄开跑,吸引了20支机器人赛队和12000名人类选手。这场约21公里的赛事,对...
    AI前言# AI# 中国制造# 人工智能
    8个月前
    13,0310
    Anthropic CEO 透露:未来3-6个月将推出GPT-5级别新模型,强化学习引领AI推理

    Anthropic CEO 透露:未来3-6个月将推出GPT-5级别新模型,强化学习引领AI推理

    Anthropic CEO Dario 透露未来 3-6 个月将推出全新模型 Anthropic 的新模型将如何区别于现有的推理模型? 在最近的一次 WSJ 采访中,Anthropic CEO Dar...
    AI前沿# Anthropic# 强化学习# 推理模型
    11个月前
    25,2910
    DeepSeek-R1:一家非美公司的开源壮举,挑战AI发展格局

    DeepSeek-R1:一家非美公司的开源壮举,挑战AI发展格局

    为什么说DeepSeek-R1的出现“毫无意义”? 我们正处在一个有趣的时代,一家非美国公司 DeepSeek 正在以一种出人意料的方式,践行着 OpenAI 最初的使命:推动真正开放、前沿的人工智能...
    AI前沿# AlphaZero# deepseek# GRPO
    11个月前
    49,8560
    DeepSeek-R1重磅开源!性能对标OpenAI,模型蒸馏、MIT协议,引领AI新潮流

    DeepSeek-R1重磅开源!性能对标OpenAI,模型蒸馏、MIT协议,引领AI新潮流

    DeepSeek-R1 正式发布:开源模型权重、API 服务及技术详解 DeepSeek-R1 是什么?为何如此重要? DeepSeek-R1 是由 DeepSeek 公司正式发布的大型语言模型,并同...
    AI前沿# MITLicense# 大型语言模型# 开源模型
    11个月前
    17,6640
    WebRL框架如何通过强化学习革命性提升LLMs网页智能体能力?

    WebRL框架如何通过强化学习革命性提升LLMs网页智能体能力?

    🌐 自我进化框架WebRL如何增强LLMs网页智能体? 大型语言模型(LLMs)一直在语言理解、常识推理和知识获取方面展现出卓越的能力。它们同样具备在复杂规划与逻辑推理的潜力。近年来,以LLMs为驱动...
    AI前沿# LLM# 强化学习
    1年前
    20,3110
    加载更多
    学AI很简单-易之网
    易之网AIGC导航网站,集AI工具网址、AI绘画、AI教程、AI项目以及AI资讯于一体的AIGC导航网站,用户可以一站式找到有用的AI工具和教程。

    AI绘画 AIGC项目教程 chatgpt 佰漫画 AI产品分享社区

    • Midjourney
    • Stable Diffusion
      • SD入门教程
      • lora模型训练
    扫码加微信学AI很简单-易之网
    扫码加微信
    Copyright © 2025 学AI很简单-易之网 冀ICP备15003481号  冀公网安备13102402000431  
    error: Content is protected !!
    网址
    网址文章软件书籍

    智能体

    智能体

    查看详情
    Manus AI
    Manus AI
    Skywork
    Skywork
    扣子空间
    扣子空间
    智能体