AI Agent 的未来:谁能真正留下来? ,,#商业化
引言:AI Agent 的十年?
Karpathy 曾预言:“未来十年是 Agent 的十年。” 这句话并非空穴来风,随着 Token 成本降低、MCP (模型组合产品) 越来越丰富、用户对 AI 过程的接受度提高,我们已经见证了 Agent 产品从 Demo 走向实际应用。例如:Manus、扣子空间、Lovart、Flowith Neo、Skywork、超级麦吉。但问题是,在大浪淘沙之后,什么样的 Agent 才能真正留下来?
如何评估 Agent 的价值?
在拆解产品价值时,可以参考以下公式:
- 能力:Agent 到底能帮你做什么?是否能形成稳定、可交付的产物?
- 信任:用户是否愿意让 Agent 接手任务?过程是否可控、行为是否可解释?
- 频率:Agent 是否能在用户需要的场景里随时调用?
每个维度最高 3 分,总分超过 8 分为好 Agent,低于 8 分则有待商榷。这一公式参考了一线投资人的观点,例如 Reid Hoffman 认为每个人身边都会有多个 AI 伙伴,但前提是你信任它、能管它、能复用它。a16z 提醒创业者,Agent 的进化路径是从 Copilot 到独立 Agent,需要能接住需求。红杉资本 用 “Always-On Economy” 描述 Agent 的未来,前提是有能力、值得信任、活在用户日常操作里。
代表性 Agent 产品拆解:
1. Manus:昙花一现?
Manus 曾因其自动拆解、规划、执行任务的能力而备受关注。但实际使用中,Manus 只能在独立网页上运行,入口较重,无法融入日常工作流程。流程容易中断,结果也不尽如人意。
- 能力:1 分 (成功率低)
- 信任:2 分 (步骤、引用内容可查)
- 频率:1 分 (难以融入工作环境)
总分:2 分
Manus 的意义在于让用户意识到 Agent 不是更聪明的对话,而是更完整的动作链。它让我们看到了新的范式:你说一个任务,它替你走完全流程。
2. 扣子空间:路线清晰,留存是关键
扣子空间 的意义在于它能稳定地完成 “MCP 调用、任务编排、结果交付” 这一完整流程。
- 能力:3 分 (链路完整,MCP 体系化使用)
- 信任:2 分 (步骤、引用内容可查)
- 频率:2 分 (需收藏页面)
总分:12 分
扣子空间 在架构上是系统最完整、迭代路径最清晰的 Agent 产品之一。但它需要解决的问题是:在哪个任务场景里,用户能第一时间想起你?
3. Lovart:直接交稿的生产力工具
Lovart 能够直接交付设计稿,用户只需提出需求,Lovart 就能自行拆解任务、选择风格、配色和分层。
- 能力:3 分 (以交付为核心的整合型能力)
- 信任:3 分 (交付质量高)
- 频率:2 分 (工具型,入口依赖用户主动保存)
总分:18 分
Lovart 几乎能满足大部分设计场景,用户只需发起多次任务,然后收割结果。
4. Flowith Neo:独特的交互体验
Flowith Neo 遵循 Planning、Action 范式,能并发执行多个任务链,并将并发节点自动组织、排序、压缩。
- 能力:3 分 (能拆能跑,执行链完整,支持高并发)
- 信任:3 分 (流程透明、失败可查、输出有状态)
- 频率:1 分 (太开放的命题)
总分:9 分
Flowith Neo 的交互方式对部分用户来说可能过于复杂,他们可能只需要一个开始和一个结束。
5. Skywork:办公场景最强 Agent
Skywork 能够分析股票,并生成 PPT。它会先确认任务范围,明确分析维度,然后分模块列出任务计划,通过 MCP 工具访问证券网、年报、同花顺 F10 页面,自动抓数,最后生成完整的 PPT。
- 能力:3 分 (精准)
- 信任:3 分 (每一段都有出处、有结构、不跑题、能兜底)
- 频率:2 分 (非日常,但做材料时会想起)
总分:18 分
Skywork 的价值在于它是一个班味很重的 Agent,知道用户需要什么,强调稳定和可信。
6. 超级麦吉:融入 OA 里的 Agent
超级麦吉 关注的是 OA (办公自动化) 里那些没人愿意做,但又天天需要人做的事情,比如发票识别、校验、归档、审批流程的权限路径判断、企业内报表的匹配、统计、解读以及可视化、供应链表单的结构化填写、字段关联与表单转化。
- 能力:3 分 (流程执行能力)
- 信任:2 分 (系统级,必须极度可靠、权限明确)
- 频率:3 分 (只要公司流程在,麦吉 就在)
总分:18 分
麦吉 的价值在于融合到 OA 里,真正地提能增效。
通用 Agent vs. 垂类 Agent:
通用 Agent 就像通才,什么都能干点,但很少能干到底;垂类 Agent 就像某个领域的专家,可能交流 0 分,干活满分。在现阶段,真正能留下来的,一定是 垂类 Agent。因为 通用 Agent 缺少垂类场景的 KnowHow,看起来啥都能做,但真要交付一个稳定、可控、可交付的结果,就开始不够看了。
专才 Agent 会被通才模型淘汰吗?
即使通用模型越来越强,基模也取代不了工程化的 Agent。
模型越来越强,能做不等于能做好:
大模型现在能完成很多以前需要工具组合的任务,但它们能干,不一定敢用。真正让 Agent 跑起来的关键,是构建长期记忆和可持续行为路径。
真正的专才 Agent,不完全来自于基模的能力:
Agent 要落地,得先能跑通一个任务流、一个标准化结果、一套刚需逻辑。Lovart 能留下来,不是因为图生得比别人好多少,而是它真的能替设计师交稿;Skywork 能留下来,是它的文档真的可以直接交给老板看。
我认同的一种未来是:通才吃长尾,专才守高峰:
通才 模型适合处理探索型任务,专才 Agent 的优势在于你已经知道你要干嘛,它能接得住,跑得完,干完了你不会再补第二遍。
信任:Agent 的护城河?
信任 不是功能的属性,而是你敢不敢交出方向盘的前提。真正让用户信任一个 Agent,是因为你能一眼看懂它做了什么;如果它错了,你能快速干预或撤回;它知道你要什么结果,它知道在边界内怎么做,你能看清楚。
ChatGPT 的火又怎么解释?
在轻度交互、工具型使用的场景里,用户的容忍度很高。但只要提及 AI 自动化流程,过程中没有人监督,最终的产物约等于交付物。
你值不值得被用户花钱,也取决于信任的折损率:
如果 AI 产品要收费做商业化,就等于你的产品力和用户需求对赌。
入口 vs. 用户心智:
真正能留下来的 Agent,不一定天天被用,但一定在该它上的时候,能被用户记起来,然后快速点开,不被别的应用截胡。
没平台入口就没机会了?
如果不能破圈,就没有流量;没有流量,你再好,也只有被大厂抄的命。要创业,入口和能力同样重要。要红,要卷视觉,要抓爆点,要抢叙事窗口。但红只是前提,接下来得活下去,所以要能跑流程、跑得起第二次、出错还能兜底。
结论:
我现在再看 Agent,看的不是它有多强,而是到底谁能留下来?谁能被顺手用上,谁就多活一轮;谁能不让我兜底,谁就值得再被试一次;谁能把结果写进业务流程,谁就能慢慢变成系统里的一部分。其他都是彩头。
我认为:所谓AI Agent,也不过是新瓶装旧酒,技术再炫酷,最终还是要回归到实用价值。用户才不会管你用了多少模型,堆了多少算力,他们只关心能不能解决问题,能不能省时省力。不能落地的技术,终究是空中楼阁,经不起市场的考验。就如同百年前的“德先生”与“赛先生”一样,如今的AI技术也要真正为人民所用,才能焕发出蓬勃的生命力。
,,,
总结与感悟:
我认为:这Agent之争,实乃用户心智之争。技术再花哨,若不能入用户之眼,入用户之手,终归是镜中花,水中月。可笑那些追逐流量之辈,不过是缘木求鱼,终将落得个竹篮打水一场空。真正的Agent,当如老黄牛,默默耕耘,为用户解决实际问题,方能立于不败之地。