谷歌发布 Gemini 大模型，能听、能说、能看！

AI前沿3年前发布 wanglu852

谷歌发布 Gemini 大模型，能听、能说、能看！

Gemini 1.0发布

发布内容：谷歌CEO宣布了 Gemini 1.0 版本的正式上线，这是原生多模态大模型，分为三个版本：Gemini Ultra、Gemini Pro 和 Gemini Nano。
Gemini Pro升级：谷歌的 ChatGPT 应用 Bard 升级至 Gemini Pro 版本，实现更高级的推理、规划、理解等能力，并保持免费。预计 Bard Advanced 将采用 Gemini Ultra。
Gemini推迟原因： Gemini模型此前因各种原因推迟发布，但谷歌为了竞争力放弃了先前的 PaLM 2，将重心转向 Gemini，并合并了 Google Brain 和 DeepMind 实验室资源进行攻关。

Gemini能力及测试

Gemini性能： Gemini Ultra 在多个任务和基准测试中表现优异，超越了 GPT-4。Gemini还在 MMLU 数据集中的得分率高达 90.0%，首次超越了人类专家。
多模态能力： Gemini是一个多模态大模型，能够无缝地理解、操作和组合文本、代码、音频、图像和视频。
性能细节：在各种测试中，Gemini的性能都超越了 GPT-4，并在回答难题之前利用推理能力进行更仔细的思考，有显著改进。

Gemini的应用领域

多领域应用： Gemini能高效处理多种信息，包括自然图像、音频和视频理解、数学推理等任务，能在科学、金融等领域快速取得新突破。
编程能力： Gemini能够理解和生成多种编程语言的高质量代码，并在编码基准测试中表现出色。

产品升级及应用

Gemini在谷歌产品中的应用

产品升级： Bard等产品将采用 Gemini Pro 进行微调版本，为用户提供更高级的功能。
智能手机应用： Pixel 8 Pro将是首款运行 Gemini Nano 的智能手机，在录音机应用中使用 Gemini Nano 来总结会议音频。

使用指南及未来规划

Gemini使用：开发者可通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。Android开发者可以通过 AICore 使用 Gemini Nano 进行构建。
Gemini未来规划： Gemini Ultra模型目前处于安全检查阶段，谷歌将在明年初向开发者和企业客户推出。

这次 Gemini 大模型发布代表了谷歌在人工智能领域的重要里程碑，展现了多模态能力和强大的性能，为多个领域的应用带来了新的可能性。

‍

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Exa AI：重新定义知识搜索的未来

Exa AI：重新定义知识搜索的未来

AI前沿 # AI搜索引擎 # 知识搜索

2年前

25,3060

Mistral AI发布Pixtral 12B：多模态大模型革新人机交互，实现高效视频识别

Mistral AI发布Pixtral 12B：多模态大模型革新人机交互，实现高效视频识别

2年前

21,9400

RAG自建避坑指南：馅饼or陷阱？成本、安全、维护全揭秘！

RAG自建避坑指南：馅饼or陷阱？成本、安全、维护全揭秘！

AI前沿 # 2 # LLM # 人工智能

1年前

24,8000

Suno v3.5：AI音乐生成工具，让每个人都能成为音乐家

Suno v3.5：AI音乐生成工具，让每个人都能成为音乐家

2年前

70,9740

error: Content is protected !!