2025机器学习大会:聚焦大模型技术、AI生态、产业变革

AI前言6天前发布 yizz
6,581 0 0
广告也精彩

2025全球机器学习技术大会:大模型驱动AI生态与产业变革

为什么需要关注大模型技术 ,,#机器学习

生成式AI正在加速重构技术版图,而以大语言模型为核心的新一轮 AI 革命,正在驱动从软件开发到产业落地的全方位变革。为了进一步推动技术交流与产业融合,2025全球机器学习技术大会(ML-Summit 2025)在上海盛大开幕。本次大会汇聚了院士、学术领军者、IEEE Fellow、顶会论文作者、一线科技产品技术实战派、开源先锋等超过50位重磅嘉宾,共同探讨大模型时代下的技术突破与落地实践。

大会有哪些亮点? ,,#产业变革

本次大会聚焦12大专题,涵盖:

  • 大语言模型技术演进
  • GenAI 产品创新与探索
  • AI 智能体
  • DeepSeek 技术解析与行业实践

来自微软、百度、阿里巴巴、腾讯、字节跳动、蚂蚁集团、智源研究院、小红书、网易、商汤科技、小米、360、AMD、数势科技、Neuriva 纽睿华、极狐、飞瓴德移民、声网、人民邮电出版社异步社区、电子工业出版社博文视点、清华大学出版社等数十家领军企业和组织的技术专家齐聚现场,分享了他们从模型训练到产品化落地的全链路实践。

各位专家有哪些精彩分享? ,,#落地实践

李建忠:大模型技术创新如何驱动AI生态和应用演进?

CSDN 高级副总裁、Boolan 首席技术专家李建忠分享了 AI 发展的几个阶段:感知 AI、生成式 AI、智能体、物理 AI。他指出语言在人类智能发展过程中起着关键作用。大语言模型不是简单概率,而是通过复杂的抽象与逻辑推理进行“理解”与“生成”,内部已形成跨语言的概念映射区域,显示出其拥有更深层次的概念抽象能力。

  • 技术演进: 强化学习显著推动了模型从“训练范式”(预训练 + 后训练)向“推理范式”转变。
    • 预训练讲知识
    • 后训练讲文明
    • 推理讲道理
  • 应用层面: 大模型正沿着两个主要方向发展:生成式 AI(AIGC)智能体(Agent
    • AIGC 正从单一文本向图像、音频、视频等多模态扩展,通过降低创作门槛重塑内容产业生态。
    • 智能体 则更偏向“执行任务”,通过规划、调用工具、协作、记忆与行动完成复杂任务。

MCP 协议Agent2Agent 分别对应“大模型调用工具” 和 “智能体之间交互”。李建忠认为,未来人类会很少直接使用传统软件,传统软件要么成为可被智能体调用的 Tools, 要么面临消亡。

杨强:联邦学习如何助力大小模型协作学习?

加拿大工程院及加拿大皇家学院院士、香港理工大学AI高等研究院院长杨强指出,目前数据分散化与隐私保护需求正对传统中心化 AI 架构提出挑战。他认为必须从学术与理论层面重新思考一个问题:大模型到底还能走多远?

  • 联邦学习: 一种结合隐私保护的分布式 AI 方法,在数据不出域的前提下,通过模型之间的参数交换来实现知识共享。
    • 横向联邦学习(增加样本数量)
    • 纵向联邦学习(扩展特征空间)
  • 迁移学习: 将已有模型在成熟领域中的能力迁移到新任务或新数据上。
    • 大模型“教授”小模型: 利用知识蒸馏(Knowledge Distillation)将大模型的通用能力蒸馏至本地小模型,解决算力受限问题。
    • 小模型“反馈”大模型: 小模型可为大模型带来领域专业知识,并生成脱敏“人造数据”向大模型查询,从而在保护隐私的前提下,实现高质量的知识迁移。

杨强总结道:AI 发展将是一场持久战,人类需要通过提示、反馈与调整,不断协助 AI 提升认知能力。

朱军:扩散策略学习有哪些进展?

IEEE Fellow、清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军带来了《扩散策略学习的若干进展》主题演讲。

  • 扩散策略: 将生成式模型,尤其是扩散模型,应用于强化学习,用于策略的建模与优化。
    • 优势: 强大的行为建模能力、生成多样解法、易于与多模态基础模型集成。
  • 进展:
    • RDT-1B: 双臂操作的扩散基础模型,以扩散模型为基础,构建更具表达力的策略模型,特别适用于如双臂机器人等动作分布天然复杂的场景。
    • SRPO: 推理速度优化方法,能够将推理速度提升约 50 倍,大幅提高扩散策略在高频控制任务中的实用性。
    • EDA: 扩散行为模型的对齐方法,探索如何将大语言模型中的对齐技术迁移至扩散模型的策略微调中。

朱军指出,Diffusion Policy 作为一个新兴方向,正逐步展现出成为具身智能基础模型的潜力。

黎科峰:DeepSeek如何引领产业智能革命?

数势科技创始人兼CEO、原京东集团副总裁、原京东商城技术负责人黎科峰带来了《DeepSeek 引领产业智能革命:从大模型平权到 AI Agent 爆发》的主题演讲。

  • AI 发展历程: 规则时代(AI 1.0)、数据时代(AI 2.0)、生成时代(AI 3.0)。
  • AI Agent 的核心能力(五大魔法): 多模态环境感知、动态复杂推理、面向目标的行动规划、智能工具调用执行和持续学习进化。
  • 企业级 AI Agent 的部署要求: 效果稳定性、系统安全性、能力可扩展性。

黎科峰认为,更具价值潜力的,是围绕企业战略与经营的“智能决策 Agent”赛道。

圆桌对话:大模型技术趋势展望与产业落地 ,,,#数据

在圆桌对话环节,各位嘉宾围绕算法、算力、数据三大 AI 核心要素如何驱动大模型持续演进展开了深入探讨。

  • 李建忠: 语言模型是通往 AGI 的最核心、最关键的道路。
  • Ramine Roane: 摩尔定律放缓,刺激了计算架构和算法层面的创新。
  • 柳钢: 大模型开源的影响力会迅速渗透到各行各业。
  • 杨强: 强化学习是一种持续学习的架构,其真正潜力还远未被挖掘。

各位嘉宾对AI未来发展趋势的预测

  • 李建忠: 下一代 AI Agent 的突破将更多来自强化学习。
  • 杨强: AI 技术的下一站,是从中心化转向分布式,并从单一的预训练和推理阶段升级为混合的多模态模型。
  • Ramine Roane: 未来很可能会见到符号主义的回归,也许它不会完全取代现有架构,但至少会与现有的架构协同工作,并以某种可扩展的方式相互补充。
  • 柳钢: 未来 AI 的大事件应该是基于开源大模型、多模态大模型技术构建的 AI Agent 在企业应用的落地,其中最看好的一个领域是 AI 智能编程

感悟

我认为:这ML-Summit 2025大会,与其说是技术交流,倒不如说是群英荟萃的“华山论剑”,高手过招,招招致命,句句珠玑。大模型这玩意,就像一个新生的婴儿,未来是龙是虫,谁也说不准。但可以肯定的是,它正在以一种前所未有的速度改变着世界,至于这改变是好是坏,恐怕只有时间能给出答案了。

,,

我的想法:

我认为:各位专家的分享既有理论高度,又有实践深度,为我们描绘了一个波澜壮阔的AI未来。这场大会不仅是一次技术盛宴,更是一次思想的碰撞,让我们对大模型技术的演进和产业落地充满了期待。

希望我的整理对您有所帮助!

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!