Agent崛起:从AutoGPT到GPTs,详解AI的MCP协议接口

AI前沿2个月前发布 yizz
6,420 0 0
广告也精彩

Agent 的前世今生与 MCP 协议详解

1. Agent 概念的兴起与演变:从自动化到智能协作

1.1 Agent 概念的起源:AutoGPT 的发布

Agent 概念的兴起可以追溯到2023年初,AutoGPT 等开源项目的发布是标志性事件。这些项目是第一批基于自然语言的 AI 自动化实践。用户只需告诉 AutoGPT 一个任务,它就能通过自然语言的自我对话,将任务拆分、规划并实现。虽然早期的 AutoGPT 成功率极低,能做的事情也很少,但它为后续 Agent 的发展奠定了基础。

1.2 Agent 概念的丰富:ToolformerOpenAI 插件计划

2023年2月,论文《Toolformer: 大模型可以教自己使用工具》的发表,以及 OpenAI 在3月底发布的插件计划,进一步丰富了 Agent 的概念。这意味着,大模型从原来的“思想家”,通过对外部工具的使用,变成了“实干家”。大模型不再局限于思考,而是能够利用外部工具解决实际问题。

例子: 就像一个木匠,以前只会设计图纸(思考),现在学会了使用锯子、锤子等工具(使用工具),可以自己动手制作家具(解决实际问题)。

1.3 Agent 的定义:一种模拟人类工作方式的 AI 系统

由于语言的泛化,Agent 的定义并没有一个标准的答案。一个常见的观点是:Agent 是一种让 AI 以类似人的工作和思考方式,来完成一系列任务的系统。

1.4 Agent 的构成:大脑、眼睛、手、工作纪要和行为 SOP

一个 Agent 可以是一个 Bot,也可以是多个 Bot 的协同。对于每个 Bot 来说,通常包括以下几个部分:

  • 大脑:负责判断和规划行为,通常需要 GPT-4 或更高水平的 LLM
  • 眼睛和手:负责确认信息和使用外部工具,一般是各种插件/action/api。
  • 工作纪要:储存已经发生的事情,通常的媒介是上下文窗口,或者一个 todo 文件,也或者数据库。
  • 行为 SOP:明确这个 Agent 的身份、任务、目标和机制。这个 SOP 可能是用户给的,也可能是由其它 Bot 给出的。

例子: 想象一个销售 Agent,它的大脑GPT-4,负责分析客户需求和制定销售策略;眼睛和手是 CRM 系统和邮件发送工具,负责获取客户信息和发送邮件;工作纪要是销售记录,记录了每次与客户的沟通内容;行为 SOP 是销售流程,规定了销售 Agent 应该如何与客户互动。

1.5 GPTsOpenAI 设计的最简版 Agent

GPTs 通常被认为是 OpenAI 设计的最简版的 Agent

  • 大脑:在 ChatGPT GPT Store 里,GPT-4 是唯一可选的 LLM
  • 眼睛和手:可以在 Capabilities 里勾选由 OpenAI 提供的第一方能力,也可以通过 Actions 来拓展更多的外部能力。
  • 工作纪要:一般来说就是对话记录,GPTs 可以回顾之前的对话。
  • 行为 SOP:存放在 Description, Instructions 以及 Knowledge 里。

2. MCP 协议AI 与工具连接的“USB-C 接口

2.1 什么是 MCP

模型上下文协议Model Context Protocol,简称 MCP)是一种全新的开放协议,专门用于标准化地为大语言模型LLMs)提供应用场景和数据背景。你可以把 MCP 想象成 AI 领域的“USB-C 接口”,它能让不同的 AI 模型与外部工具和数据源轻松连接。

类比: 就像 USB-C 接口 让你的电脑更容易连接各种设备一样,MCPAI 模型更简单地获取数据、工具与服务。

2.2 为什么要用 MCP,而不是传统的 API

通常,AI 系统想连接外部工具时,需要单独整合多个不同的 API。每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。

比喻:API 就像不同的门,每扇门都需要自己的钥匙和特定的规则。

2.3 MCP 的优势:简化开发、灵活性强、实时互动、安全可靠、扩展性强

  • 简化开发:一次标准化整合,多次复用,不再重复开发。
  • 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。
  • 实时互动:长连接保证数据实时更新。
  • 安全可靠:内置标准化安全和权限控制。
  • 扩展性强AI 系统扩展时,只需连接新的 MCP 服务器。

2.4 MCP 的工作原理:客户端-服务器架构

MCP 采用简单的客户端-服务器架构:

  • MCP 主机(Host):如 Claude 桌面应用或智能开发环境(IDE),需要访问外部数据或工具。
  • MCP 客户端(Client):与 MCP 服务器建立一对一的稳定连接。
  • MCP 服务器(Server):提供特定功能,连接本地或远程的数据源。
  • 本地数据源:文件、数据库或服务。
  • 远程服务:外部 API 或互联网服务。

简单说MCP 像一座桥梁:它本身不处理复杂逻辑,只负责协调 AI 模型与工具之间的信息流动。

2.5 MCP 的应用案例:旅行规划助手、智能 IDE、复杂的数据分析

  • 旅行规划助手AI 助手通过 MCP 统一协议,查看日历、订机票、发邮件确认,无须单独整合每个工具。
  • 智能 IDEIDE 通过 MCP 一次连接所有功能,带来更丰富的上下文支持,更强大的智能建议。
  • 复杂的数据分析AI 自动发现并连接多个数据库和可视化工具,通过统一的 MCP 接口轻松完成分析任务。

2.6 何时使用传统 API

如果你的应用场景需要精准且严格受控的交互方式,那么传统 API 可能更合适。MCP 提供广泛而灵活的动态能力,更适合需要上下文理解的场景,但不一定适用于严格受控的场合。

2.7 如何开始使用 MCP

  1. 定义能力:明确你的 MCP 服务器提供哪些功能。
  2. 实现 MCP 层:按照协议标准进行开发。
  3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。
  4. 创建资源/工具:开发或连接你的数据源和服务。
  5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。

3. 总结:MCPAI 与外部世界连接的关键

MCP 不仅仅是另一种 API,而是一个强大的连接框架,让 AI 应用能更智能、更动态地融入丰富的上下文环境,快速实现复杂的功能互动。它标准化了 AI 模型与外部工具和数据源的连接方式,降低了开发复杂度,提高了灵活性和扩展性。

我认为:

Agent 如雨后春笋般涌现,实乃 AI 发展之必然。MCP 协议的出现,更是为 Agent 插上了翅膀,使其能够自由翱翔于数据与工具的海洋。然而,切不可盲目追捧,须谨记“君子性非异也,善假于物也”。 Agent 虽好,终究是工具,用之正则利国利民,用之邪则祸国殃民。

,,,,

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!