Manus 直播实测:AI 时代人机协作的未来?
Manus 是什么?它能做什么? #通用agent
Manus 的本质:AI 操纵的 Linux 虚拟机和浏览器 #linux
Manus 可以被理解为一个由 AI 操控的,没有图形界面的 Linux 虚拟机,以及一个浏览器。它能够感知电脑环境,执行各类操作,包括运行 Linux 指令、调用库和程序(如 cd
、ls
指令、Python 等),以及访问网页、获取 API 接口的数据。
但是,由于没有图形界面,Manus 无法直接运行图形程序,例如《宝可梦》。同时,网页上那些阻碍人类使用的要素(如强制登录、余额不足的充值弹窗)也会影响 Manus 的使用。
如何与 Manus 交互? #vscode
为了方便用户通过键鼠介入,Manus 提供了用户可视的命令行视窗、浏览器、VSCode 三种选项,以便查看运行指令、接管网页和修改文件。用户也可以给 Manus 上传文件,未来或许还能对接私有 API。
Manus 的运作逻辑:Claude AI + 特训推理模型 #推理模型
Manus 的主要智力担当是 Claude AI 和某个特训过的推理模型。当接收到人类指令时,它会将指令拆解为完成任务所需的子步骤,生成一个 todolist 文档,降低实现难度。
基于这个 todolist,Manus 每完成一个子任务就打个 ✅,为 AI 指明多步骤任务中每一步的执行要求。然后,它会针对 list 中的每个 todo,按需调用相关工具(如 Linux 命令、Python、浏览器等),逐步推进子步骤,评估完成质量。
这些步骤可以是安装软件环境、创建文档、浏览网页、编写程序和网页等,嵌套利用起来,就可以生成原始指令的产出物。例如,它可以网页搜索、网页阅读总结,生成一份 XX 市场调研分析报告。
Manus 的应用场景:不只是网页和报告 #aigc
Manus 不仅能做网页、做报告,还能玩 HTML 的 2048 游戏、写游戏攻略心得、帮你安装宝可梦游戏、安装 NDS 模拟器、代替你登录可灵 AI 输入 prompt 做 AIGC 视频。
Manus 实测 Case:能做到什么程度? #案例
为了测试 Manus 的能力边界,我设计了 6 个任务:
- 创作世界首支 AI 自主创作的自我介绍视频
- 草拟邮件,找到 Manus 官方邮箱,完成 Manus 邀请码的申请
- 自主玩 2048 网页游戏,并给自己解说,写游戏心得
- 安装《宝可梦:黑》,并尝试捕获第一只宝可梦
- 自行进入可灵 AI,创作一条由 AI 操作生成的 AI 视频
- 让 Manus 自行调查自己所处的环境,输出 Manus 自己的技术架构
Case 效果分析 #2048
- 创作视频: 真的创作视频了,用 OpenCV 一帧帧画的,但有点丑,也不能自己配上音。
- 草拟邮件: 能帮我草拟邮件,但是还不支持使用邮件服务代发邮件,可能官方有限制。
- 玩 2048: 真的玩起来了,超出预期!最高分 192 分,比起人类是差很多,但终究是模拟键鼠输入玩起来了。看来 Manus 能玩一切非即时性游戏。
- 安装《宝可梦:黑》: 这个 case 很神奇,看起来它似乎通过主动改造自己的环境,找到了让本不能运行的游戏运行的方案。我给它开小灶,直接把包传给它了,然后自行安装的很顺利。
- 创作 AI 视频: 自主设计了整个 AI 视频的脚本、文生图提示词。 我接管登录了可灵 AI,也能成功调整管理台参数尝试生成。但是因为账号没钱,弹出了收费弹窗,无法继续。
- 调查自身架构: 大部分都被产品工程限制了,但最终输出了一些在官方网站上查不到的方案设计内容,且经官方证实,确实大部分正确。
对 Manus 的评价:AI 实习生? #组织架构
你可以把 Manus 当做一个非常肯干活的实习生。它是用 LLM 大模型拆解原始任务为多个子任务,再针对一个个子任务,逐步生成行动步骤/内容/方案。
因此,Manus 的每个子任务能力,就是当下 LLM 的智力水平——缺乏实战经验、缺点灵性、但能 24 小时极高吞吐量、极速干活的在校大学实习生拼起来的最终产物的水平。
Manus 的每个 case 的 token 花费基本在 2 美金,随着模型发展,这个价格还会无限下探,比人类实习生的成本低太多了。未来的组织架构必然会与现在有巨大的差别。
Manus 的问题与挑战 #改进
- 在人机协作过程中,人和 AI 反复拉扯修改任务过程中的中间产物,是非常不好的体验。
- Manus 毕竟不是我们的随身助理,且尚不支持跨任务项目的对话记忆、账号登录态、文件互通,以及文字语言是对现实信息的有损压缩。
- 数据质量、背景信息有限、无法持续成长等原因,使得 Manus 无法承担更多期待。
Manus 的意义:重新看清未来 #协作机制
Manus 打通了几乎全部的链路,以极低的体验成本,让人类能够一站式地托管完成复杂的任务。未来胜出的可能并不是拥有最强技术的公司,而是那些真正理解了 AI 与人类如何共进化、并能建立持续、稳定的协作机制的公司。
Manus 以极高的产品完成度,再次把隔在人和 agent 的未来的迷雾吹散了一些,透出了更多光亮。
我认为:
这 Manus 呀,就像一盏风雨中摇曳的灯,虽不能照亮所有黑暗,却也给了我们一丝希望。它展现了 AI 的潜力,也暴露了它的局限。我们既要看到它的光明,也要正视它的阴影。毕竟,这人机协作的未来,还需我们一步一个脚印地去探索啊!