GC Next 25:AI模型井喷,Gemini 2.5领衔,A2A协议革新

AI前言3周前发布 yizz
4,744 0 0
广告也精彩

Google Cloud Next 25 AI 更新解读:重磅模型、未来协议与落地案例全盘点

Google Cloud Next 25 AI 更新有哪些亮点?

Google 在 Google Cloud Next 25 大会上发布了近 20 个 AI 相关的模型、应用、开发工具和硬件。本次更新内容繁多,信息分散。以下是本次更新的总结:

  1. 发布了许多重磅且炫酷的 AI 模型与工具,但部分产品尚处于期货阶段,期待 Google 尽快发布。
  2. Gemini 2.5 Flash 即将发布,主打高性价比推理。结合此前登顶的 2.5 Pro,有望重夺 AI 领域的领先地位。
  3. 发布了 A2A 协议,旨在实现 Agent 之间的无缝协作,引领未来 Agent 协同规范。
  4. 全面公开了 Google AI 的 601 项 AI 落地案例,为应用层创业者提供了明确的方向。

本文将重点介绍 5 个 AI 新模型、1 个面向未来的 AI 协议以及 6 项其他重点更新。

有哪些值得关注的 AI 模型更新?

Google 发布了以下 5 个值得关注的 AI 模型更新:

Gemini 2.5 Flash:快速、便宜的推理模型

  • Gemini 2.5 Pro:此前已推出,拥有 100W tokens 上下文,支持多模态提示,并在众多 Benchmark 测试中名列前茅。
  • Gemini 2.5 Flash:即将发布,与前代 2.0 Flash 不同,侧重于推理,并延续了快速、便宜的优点。
    • 推理程度可根据对话任务复杂度动态调整。
    • 开发者可以自定义模型的推理程度,便于控制成本。
    • 预计很快在 Vertex AI 中可用。

Veo 2:超一流视频生成模型

  • Veo 2 是一款值得关注的视频生成模型,支持以下特性:
    • P 视频:无需手动修图,移除视频中不需要的元素。例如,移除视频中的吊威亚绳子。
    • 关键帧生成视频:使用首尾画面生成流畅的视频。
    • 扩展画面:对已有视频画面进行自然扩展,适合将横版视频转换为竖版。
    • 镜头控制:在视频生成时调整镜头构图、摄像机角度和控制节奏,创建延时摄影效果或无人机跟随风格的镜头。
  • Google VideoFX 使用的是 Veo 2 模型。
  • 现已开放 waitlist 申请。

如何申请 Veo 2 的 waitlist?

您可以通过以下链接申请 Veo 2 的 waitlist:Veo 2 Waitlist

Chirp 3:10 秒语音样本即可创建逼真自定义语言

  • Chirp 3 是 Google 的音频理解与生成模型,提供了超过 35 种语言(含中文)的自然逼真语音,并支持八种音色选项。
  • 亮点:
    • 自定义语音生成:只需 10 秒的短录音,即可生成非常逼真的自定义语音。
      • 你可以拿游戏、动漫里的角色的任何一段音频,合成对应的虚拟人语音。
    • 区分音频中的说话人身份:能够区分多个说话人录音中“哪句话是谁说的”,方便会议摘要、播客分析、访谈录音转写。

如何体验 Chirp 3?

目前 Chirp 3 只能通过 API 调用,您可以通过以下链接了解更多信息:Chirp 3 API

Lyria:文本到音乐生成模型

  • Lyria 也被更新到了 Vertex AI,可从简单文本提示创建完整音乐作品。
  • 现已开放 waitlist 申请。

如何申请 Lyria 的 waitlist?

您可以通过以下链接申请 Lyria 的 waitlist:Lyria Waitlist

Imagen 3:图像生成和编辑能力改进

  • Imagen 3 提升了编辑/修复功能效果,能够快速移除、重绘图像中不需要的对象、瑕疵。
  • 你可以在 Gemini 应用、ImageFX 中开始使用它。

如何体验 Imagen 3?

您可以通过以下方式体验 Imagen 3:

什么是 Agent 2 Agent 协议?

Agent 2 Agent (A2A) 是一种用于 Agent 与 Agent 联动协作的开放协议,是对 Anthropic 模型上下文协议 (MCP) 的补充。

  • MCP 侧重于为 Agent 接入各类工具与信息。
  • A2A 更侧重让“你要用的 Agent”(客户端 Agent)能够与“提供第三方支持的 Agent”(远程 Agent)进行联动。前者负责制定、传达任务,后者负责执行。
  • 在 A2A 连接的过程中,Agent 之间可以互相发送消息,传达上下文信息、回复等。A2A 协议的连接可以持续保持很久,直到完成任务。

还有哪些值得关注的 AI 应用、开发者工具和案例?

除了模型更新和 A2A 协议外,Google 还面向一般用户和开发者更新了一系列应用和开发工具,并公开了 601 个真实 AI 应用案例。以下是一些重点:

Firebase Studio:搭载最强 AI 的云端 AI 编程工具

  • 开发者可以用 Firebase 一站式完成应用开发的全流程,包括 AI coding、编译构建、云服务部署和运行。
  • 无需下载 IDE,在云端即可完成 AI 编程。
  • 得益于 Gemini 2.5 Pro 的加持,开发者可以体验到一流的 Coding 体验。

如何体验 Firebase Studio?

您可以通过以下链接体验 Firebase Studio:Firebase Studio

ADK:Google 的新 Agent 开发框架

  • ADK (Agent Development Kit) 是 Google 新发布的开发框架,适用于构建 Multi-Agent 系统的开发。

如何了解更多关于 ADK 的信息?

开发者可以访问以下链接查看具体项目:ADK Documentation

Google Workspace:集成大量 AI 服务

Google 为 Workspace 套件追加了大量的 AI 能力,为 Docs、Sheets、Meet、Chat 等日常工具带来更多 AI 功能:

  • Docs:可以将 Google 文档变成音频版本,或用播客风格概括文档亮点,新增“帮我改进”功能。
  • Vids:可用 Veo2 视频生成模型。
  • Sheets:支持用 AI 自动分析数据,并生成洞察。

Google AI Studio 整体 UI 优化

Google 优化了 AI Studio 的整体 UI 设计,使其风格向 Gemini Web 应用靠拢,变得更加清晰。

如何体验 Google AI Studio?

您可以通过以下链接体验 Google AI Studio:Google AI Studio

Google 的 601 个真实客户带来的 AI 案例

Google 更新了过去一年他们推动的 AI 客户案例,涉及客户代理、员工代理、创意代理、代码代理、数据代理和安全代理等多个应用场景。

如何查看详细案例集?

您可以通过以下链接查看详细案例集:Google AI Use Cases

Ironwood TPU:Google 第 7 代 AI 芯片

  • Ironwood 是 Google 即将推出的第 7 代 AI 芯片,是他们迄今为止性能最高、可扩展性最强的定制 AI 加速器,也是首款专为推理而设计的加速器。
  • 峰值计算性能是上代 Trillium 的 5 倍,将大幅加速 AI 推理效率。

总结

Google Cloud Next 25 发布了众多令人期待的 AI 模型、工具和应用,尤其以 Gemini 2.5 FlashVeo 2A2A 协议 最受关注。这些更新不仅展示了 Google 在 AI 领域的强大实力,也为开发者和企业提供了更多创新和应用的可能性。

我认为:Google 推出如此多的模型、工具和案例,无疑是在AI领域的一次猛烈进攻。然而,能否真正重回“老大哥”地位,关键在于这些技术的落地速度和实际应用效果。倘若只是空中楼阁,终究难以服众。正如那句老话所说:“行胜于言”。

, , , #Gemini2.5Flash, , , , ,

标签: , , #Gemini2.5Flash, , , , ,

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!