AI Agent:从「Manus」爆火看 RPA Agent 的实际落地方向
1. 「Manus」为何爆火?与以往 AI Agent 产品有何不同?
1.1 「Manus」爆火的原因是什么?实际能力如何?
近期,由蝴蝶效应公司推出的通用 AI Agent 产品「Manus」在 AI 圈内引起广泛关注,被誉为“全球首款真正自主的 AI Agent”,甚至出现了“一码难求”的现象。那么,「Manus」究竟为何突然爆火呢?
「Manus」在官方 Demo 演示中展示了其在市场调研、文件批量处理、旅行规划和专业数据分析等方面的能力。它与以往的 AI Agent 最大的不同在于,它配备了一个独立的虚拟云端浏览器,而不是直接操控用户的电脑。在与用户对话的屏幕右侧,「Manus」会实时呈现其执行任务的过程。
然而,「Manus」的实际能力是否真的如官网 Demo 所示那样“丝滑”呢?根据机器之心等多家科技媒体以及个人用户的实测,其效果一般,并未超出已有的 AI Agent 产品的预期。例如,在调用其他平台的 API 时可能会出现错误,处理复杂任务时容易触发服务器宕机等问题。
1.2 「Manus」的技术原理是什么?
实际上,做「Manus」的技术难度并不大,可以简单理解为“大模型主干 + 多个小模型组件”的架构。「Manus」采用了“Multiple Agent”(多代理)的架构,运行在独立的虚拟机中。该架构包含规划代理、执行代理和验证代理,通过分工协作机制来提升复杂任务的处理效率。
更通俗地说,可以理解为“手脑协同”的模式。「Manus」以基础大模型为核心,作为“大脑”来提供通用的智能和推理能力。在此基础上,通过多个小模型组件(如规划代理、执行代理和验证代理)分工协作,分别负责任务规划、具体执行和结果验证。这些小模型组件就像是“手脚”,能够灵活地完成各种具体任务,比如编写代码、浏览网页、分析数据等。
1.3 为什么说「Manus」的技术难度相对不大?
正因为技术难度相对不大,所以后续开源社区中出现了一些针对 Manus 的开源项目,比如 CAMEL AI 团队开源的 OWL 和 MetaGPT 团队开源的 OpenManus。
1.4 AI Agent 与 RPA 有什么关系?
「AI Agent」更像是实现了新型自动化的 RPA(机器人流程自动化)。RPA 主要使用结构化数据和规则执行预定义的重复任务,而 Agent 可以根据复杂的数据和上下文做出决策并适应情况,本质上即是在用户交互界面级别模仿人类行为。
Anthropic 首席科学官 Jared Kaplan 曾表示:“我认为我们将进入一个新时代,模型可以使用人类使用的所有工具来完成任务。”,而让 AI Agent 使用人类所有工具来完成任务对于目前来说,仍是一种畅想。「Manus」们正在做的都是同一件事情。
2. 为何说 RPA Agent 是更实际的落地方向?
2.1 AI 领域的重要技术趋势是什么?
推进自主 AI Agent 的发展是今年人工智能领域公司最重要的技术趋势之一。Gartner 预测,到 2028 年,至少 15% 的日常工作决策将通过 AI Agent 完成。微软、谷歌、Anthropic 等公司陆续推出了 AI Agent 及相关功能,使用 AI Agent 帮助用户自主操控计算机、手机等智能设备。
2.2 AI Agent 的发展方向是什么?
可以看出,让 AI 操控计算机,RPA Agent 正在成为各家大厂巨头实际业务落地的方向,尽管各有差异,但均是为其已有或重点业务方向所服务。
3. 大厂在 AI Agent 方面的布局有何异同?
(原文未提供具体细节,需要补充更多资料才能详细回答)
4. 实现自主操控计算机的 AI Agent 需要哪些能力?
(原文未提供具体细节,需要补充更多资料才能详细回答)
总结
AI Agent 领域正在快速发展,从「Manus」的爆火可以看出,市场对自主 AI Agent 有着极高的期待。然而,目前 AI Agent 的实际能力与人们的期望之间还存在差距。RPA Agent 作为一种更实际的落地方向,正在受到越来越多厂商的关注。未来,随着技术的不断进步,我们有理由相信 AI Agent 将在各行各业发挥更大的作用。
我认为:这“AI Agent”啊,就好比那《西游记》里的孙悟空,本领虽大,却也离不开紧箍咒的约束。如今的 AI Agent,看似神通广大,能处理各种任务,实则还需不断打磨,方能真正成为人们得力的助手。切莫盲目乐观,以为有了 AI Agent 便可高枕无忧,须知技术发展永无止境,仍需脚踏实地,步步为营。 Agent,
我的感悟:
这篇文章让我对 AI Agent 领域有了更深入的了解。Manus 的爆火反映了人们对 AI Agent 的高度关注和期待,但也提醒我们,目前 AI Agent 的发展还处于早期阶段,仍面临着许多挑战。RPA Agent 作为一种更务实的落地方向,值得我们关注。未来,AI Agent 的发展需要技术人员、研究人员以及各行各业的共同努力,才能真正实现 AI 赋能社会的目标。