Google Cloud Next 25 AI 更新解读:重磅模型、未来协议与落地案例全盘点
Google Cloud Next 25 AI 更新有哪些亮点?
Google 在 Google Cloud Next 25 大会上发布了近 20 个 AI 相关的模型、应用、开发工具和硬件。本次更新内容繁多,信息分散。以下是本次更新的总结:
- 发布了许多重磅且炫酷的 AI 模型与工具,但部分产品尚处于期货阶段,期待 Google 尽快发布。
- Gemini 2.5 Flash 即将发布,主打高性价比推理。结合此前登顶的 2.5 Pro,有望重夺 AI 领域的领先地位。
- 发布了 A2A 协议,旨在实现 Agent 之间的无缝协作,引领未来 Agent 协同规范。
- 全面公开了 Google AI 的 601 项 AI 落地案例,为应用层创业者提供了明确的方向。
本文将重点介绍 5 个 AI 新模型、1 个面向未来的 AI 协议以及 6 项其他重点更新。
有哪些值得关注的 AI 模型更新?
Google 发布了以下 5 个值得关注的 AI 模型更新:
Gemini 2.5 Flash:快速、便宜的推理模型
- Gemini 2.5 Pro:此前已推出,拥有 100W tokens 上下文,支持多模态提示,并在众多 Benchmark 测试中名列前茅。
- Gemini 2.5 Flash:即将发布,与前代 2.0 Flash 不同,侧重于推理,并延续了快速、便宜的优点。
- 推理程度可根据对话任务复杂度动态调整。
- 开发者可以自定义模型的推理程度,便于控制成本。
- 预计很快在 Vertex AI 中可用。
Veo 2:超一流视频生成模型
- Veo 2 是一款值得关注的视频生成模型,支持以下特性:
- P 视频:无需手动修图,移除视频中不需要的元素。例如,移除视频中的吊威亚绳子。
- 关键帧生成视频:使用首尾画面生成流畅的视频。
- 扩展画面:对已有视频画面进行自然扩展,适合将横版视频转换为竖版。
- 镜头控制:在视频生成时调整镜头构图、摄像机角度和控制节奏,创建延时摄影效果或无人机跟随风格的镜头。
- Google VideoFX 使用的是 Veo 2 模型。
- 现已开放 waitlist 申请。
如何申请 Veo 2 的 waitlist?
您可以通过以下链接申请 Veo 2 的 waitlist:Veo 2 Waitlist
Chirp 3:10 秒语音样本即可创建逼真自定义语言
- Chirp 3 是 Google 的音频理解与生成模型,提供了超过 35 种语言(含中文)的自然逼真语音,并支持八种音色选项。
- 亮点:
- 自定义语音生成:只需 10 秒的短录音,即可生成非常逼真的自定义语音。
- 你可以拿游戏、动漫里的角色的任何一段音频,合成对应的虚拟人语音。
- 区分音频中的说话人身份:能够区分多个说话人录音中“哪句话是谁说的”,方便会议摘要、播客分析、访谈录音转写。
- 自定义语音生成:只需 10 秒的短录音,即可生成非常逼真的自定义语音。
如何体验 Chirp 3?
目前 Chirp 3 只能通过 API 调用,您可以通过以下链接了解更多信息:Chirp 3 API
Lyria:文本到音乐生成模型
- Lyria 也被更新到了 Vertex AI,可从简单文本提示创建完整音乐作品。
- 现已开放 waitlist 申请。
如何申请 Lyria 的 waitlist?
您可以通过以下链接申请 Lyria 的 waitlist:Lyria Waitlist
Imagen 3:图像生成和编辑能力改进
- Imagen 3 提升了编辑/修复功能效果,能够快速移除、重绘图像中不需要的对象、瑕疵。
- 你可以在 Gemini 应用、ImageFX 中开始使用它。
如何体验 Imagen 3?
您可以通过以下方式体验 Imagen 3:
- Gemini 应用
- ImageFX:ImageFX
什么是 Agent 2 Agent 协议?
Agent 2 Agent (A2A) 是一种用于 Agent 与 Agent 联动协作的开放协议,是对 Anthropic 模型上下文协议 (MCP) 的补充。
- MCP 侧重于为 Agent 接入各类工具与信息。
- A2A 更侧重让“你要用的 Agent”(客户端 Agent)能够与“提供第三方支持的 Agent”(远程 Agent)进行联动。前者负责制定、传达任务,后者负责执行。
- 在 A2A 连接的过程中,Agent 之间可以互相发送消息,传达上下文信息、回复等。A2A 协议的连接可以持续保持很久,直到完成任务。
还有哪些值得关注的 AI 应用、开发者工具和案例?
除了模型更新和 A2A 协议外,Google 还面向一般用户和开发者更新了一系列应用和开发工具,并公开了 601 个真实 AI 应用案例。以下是一些重点:
Firebase Studio:搭载最强 AI 的云端 AI 编程工具
- 开发者可以用 Firebase 一站式完成应用开发的全流程,包括 AI coding、编译构建、云服务部署和运行。
- 无需下载 IDE,在云端即可完成 AI 编程。
- 得益于 Gemini 2.5 Pro 的加持,开发者可以体验到一流的 Coding 体验。
如何体验 Firebase Studio?
您可以通过以下链接体验 Firebase Studio:Firebase Studio
ADK:Google 的新 Agent 开发框架
- ADK (Agent Development Kit) 是 Google 新发布的开发框架,适用于构建 Multi-Agent 系统的开发。
如何了解更多关于 ADK 的信息?
开发者可以访问以下链接查看具体项目:ADK Documentation
Google Workspace:集成大量 AI 服务
Google 为 Workspace 套件追加了大量的 AI 能力,为 Docs、Sheets、Meet、Chat 等日常工具带来更多 AI 功能:
- Docs:可以将 Google 文档变成音频版本,或用播客风格概括文档亮点,新增“帮我改进”功能。
- Vids:可用 Veo2 视频生成模型。
- Sheets:支持用 AI 自动分析数据,并生成洞察。
Google AI Studio 整体 UI 优化
Google 优化了 AI Studio 的整体 UI 设计,使其风格向 Gemini Web 应用靠拢,变得更加清晰。
如何体验 Google AI Studio?
您可以通过以下链接体验 Google AI Studio:Google AI Studio
Google 的 601 个真实客户带来的 AI 案例
Google 更新了过去一年他们推动的 AI 客户案例,涉及客户代理、员工代理、创意代理、代码代理、数据代理和安全代理等多个应用场景。
如何查看详细案例集?
您可以通过以下链接查看详细案例集:Google AI Use Cases
Ironwood TPU:Google 第 7 代 AI 芯片
- Ironwood 是 Google 即将推出的第 7 代 AI 芯片,是他们迄今为止性能最高、可扩展性最强的定制 AI 加速器,也是首款专为推理而设计的加速器。
- 峰值计算性能是上代 Trillium 的 5 倍,将大幅加速 AI 推理效率。
总结
Google Cloud Next 25 发布了众多令人期待的 AI 模型、工具和应用,尤其以 Gemini 2.5 Flash、Veo 2 和 A2A 协议 最受关注。这些更新不仅展示了 Google 在 AI 领域的强大实力,也为开发者和企业提供了更多创新和应用的可能性。
我认为:Google 推出如此多的模型、工具和案例,无疑是在AI领域的一次猛烈进攻。然而,能否真正重回“老大哥”地位,关键在于这些技术的落地速度和实际应用效果。倘若只是空中楼阁,终究难以服众。正如那句老话所说:“行胜于言”。
, , , #Gemini2.5Flash, , , , ,
标签: , , #Gemini2.5Flash, , , , ,