AI大模型淘汰赛:多模态AGI,阶跃星辰破局之路

AI前言10小时前发布 yizz
1,525 0 0
广告也精彩

AI 大模型淘汰赛:阶跃星辰多模态 AGI 之路

AI 大模型进入淘汰赛,如何看待行业发展?

目前,AI 大模型领域竞争激烈,各头部公司不断发布新模型。但阶跃星辰创始人兼 CEO 姜大昕认为,现阶段的重点仍然是追求智能上限,而不是在现有水平上修修补补。他强调,要实现 AGI(通用人工智能),必须提升 AI 的智商

为什么坚持基础模型研发?

尽管一些初创公司开始放弃基础模型研发,但姜大昕表示,AI 行业技术发展迅速,阶跃星辰会坚持基础模型研发,因为模型和应用是相辅相成的。模型决定应用的上限,而应用为模型提供具体的应用场景和数据。

多模态是 AGI 的必经之路吗?

姜大昕认为,多模态是实现 AGI 的关键路径。他认为 Agent 爆发需要两个条件:多模态能力和慢思考能力

什么是多模态?

多模态是指 AI 不仅能理解文字,还能看图、听声、理解视频。就像人一样,通过眼耳口鼻全面理解世界。

阶跃星辰在多模态领域的布局

阶跃星辰在多模态模型方面投入巨大,已发布 16 款多模态模型,覆盖图像、视频、语音、音乐等领域,坚持原生多模理念。但姜大昕也坦言,多模态模型领域目前还没有出现 GPT-4 时刻,技术上仍有挑战。

AI 如何一步步逼近智能的上限?

姜大昕描绘了 AI 逼近智能上限的「三部曲」演进路线图:

第一阶段:模拟世界(模仿学习阶段)

AI 通过海量数据学习,预测下一个词或下一帧画面,目的是学会这个世界的样子和各种东西的特征。这就像小孩学说话,先模仿。

第二阶段:探索世界(强化学习阶段)

AI 培养解决复杂问题的能力,例如解奥数题、写复杂代码,需要“慢思考”。通过强化学习,AI 在不断试错中学会解决难题。

第三阶段:归纳世界(机器自主学习阶段)

AI 不仅能解决已知问题,还能自己发现新规律,进行创新。例如在科研领域帮助科学家发现新材料、新药物。

这三个阶段与 OpenAI 提出的 AGI 五个 Level 在核心理念上不谋而合。

理解生成一体化为什么重要?

在多模态领域,姜大昕多次强调理解生成一体化的重要性。

什么是理解生成一体化?

理解生成一体化是指模型既能看懂图像、视频的含义,又能根据理解创作新的图像、视频。现在很多时候是“看图用 A 模型,画图用 B 模型”,配合不起来。

理解生成一体化的重要性

如果理解和生成是两套系统,模型很难真正“懂”你,生成的物件也可能不合逻辑。

阶跃星辰如何实现商业价值?

阶跃星辰采取“超级模型与超级应用双轮驱动”的策略。

智能终端 Agent 是重点发力方向

姜大昕认为,智能终端是用户感知和体验的延伸。AI 与智能终端深度融合,能更好地理解用户需求和任务上下文。

OPPO Find X8 Ultra 的应用案例

OPPO Find X8 Ultra 首发的“一键闪记”功能,通过 AI 智能识别手机屏幕上的内容,为用户生成摘要,并将碎片化的信息归类到不同的记忆合集。这背后搭载的就是阶跃星辰多模态模型

选择手机作为切入点的价值

手机具有天然的多模态交互属性和庞大的用户基数,为模型迭代提供了丰富的真实数据和即时反馈。

总结:阶跃星辰的 AGI 之路

阶跃星辰的技术路线清晰:瞄准 AGI,死磕多模态和理解生成一体化这些硬核问题。在应用上,找准智能终端这个突破口,与硬件厂商把场景做深做透。

这条路充满挑战,但姜大昕和他的团队充满决心。通过 AI 解决真实世界的问题,并在市场获得用户认可,才有机会探索 AGI 的天花板。


我认为:AI 的发展并非一蹴而就,如同鲁迅先生笔下的“地上本没有路,走的人多了,也便成了路”。阶跃星辰选择了一条充满挑战但充满希望的道路,他们坚持基础研究,注重多模态能力的提升,并积极探索商业应用。这条路或许漫长而艰辛,但正如鲁迅先生所说:“希望本无所谓有,无所谓无的。这正如地上的路;其实地上本没有路,走的人多了,也便成了路。” 只要坚持不懈,终将到达 AGI 的彼岸。

, , , ,

感悟:

这篇文章介绍了阶跃星辰在 AI 大模型领域的探索和布局,尤其是在多模态 AGI 方面的努力。文章逻辑清晰,从行业现状、技术路线到商业应用,全面地展现了阶跃星辰的战略和愿景。其中,姜大昕对于 AI 发展阶段的划分和“理解生成一体化”的强调,都体现了其深刻的思考和对技术趋势的把握。

我个人认为,AI 的发展需要务实和理想的结合。一方面,要脚踏实地解决实际问题,获得商业价值;另一方面,也要坚持对 AGI 的探索,不断突破技术瓶颈。阶跃星辰的“超级模型与超级应用双轮驱动”策略,正是这种结合的体现。

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!