Gemini 3 Pro 上线:2025年最牛逼的模型?
经历了漫长的等待,Gemini 3 Pro 终于正式上线了。之前关于它的传言不断,但这次是真的来了。实测之后,我认为这就是2025年最牛逼的模型,即使抱有很高的预期,依然觉得 Google 太强了。
Gemini 3 Pro 在排行榜中的表现如何?
目前,在所有主要的 Arena 排行榜中,Gemini 3 Pro 几乎全部排名第一。你可以在 AI Studio 里使用它,网址是:https://aistudio.google.com/。Google Gemini 网页版也已经上线。
Gemini 3 Pro 的跑分有多强?
说实话,Gemini 3 Pro 的跑分有点强的离谱,直接给我看懵了。几乎所有的指标都是断层领先,除了软件工程能力上,比 GPT-5.1 和 Claude Sonnet 4.5 差一点,其他的都是断档的存在。这张表里的数据,第一眼看的时候,我以为自己熬夜熬多了眼睛熬花了。
Humanity’s Last Exam 评测结果如何?
Humanity’s Last Exam 是一个非常著名的评测集,它把各种学科里最变态、最抽象的题合并在一块,号称人类最后的考试。在这张卷子上,Gemini 2.5 Pro 只有 21.6%,Claude Sonnet 4.5 是 13.7%,GPT-5.1 是 26.5%。而 Gemini 3 Pro 达到了 37.5%,开了工具使用之后,更是直接干到了 45.8%,非常离谱。
MathArena Apex 评测结果如何?
MathArena Apex 可以理解为超难奥赛压轴题专场。GPT-5.1 在这个考试里只拿了 1 分,Claude Sonnet 4.5 是 1.6 分,Gemini 2.5 Pro 是 0.5 分。而 Gemini 3 Pro 拿了 23.4 分。这就像是一个小学生还在掰手指头算加减法,旁边的大学生 Gemini 3 Pro 已经开始用微积分徒手搓火箭了。
ScreenSpot-Pro 评测结果如何?
ScreenSpot-Pro 是一个专门用来折磨多模态模型的 GUI Grounding(界面定位)评测集,而且是偏专业场景+高分辨率大屏那种地狱难度。GPT-5.1 是 3.5%,Claude Sonnet 4.5 是 36.2%,Gemini 3 Pro 是 72.7%。Gemini 3 Pro 在做电脑操作这个角色上,是毁灭级的强,它几乎能精准地识别屏幕上的每一个按钮、每一个图标、每一行字。以后那种让 AI 帮你操作电脑干活的 Agent,Gemini 3 Pro 就是唯一的真神。
Gemini 3 Pro 最秀的地方是什么?前端代码能力!
Gemini 3 Pro 最牛逼的是前端代码能力。真的非常厉害!
简单场景示例
比如,这个 Prompt:
“设计并创建一个非常有创意、精致且细节丰富的体素艺术场景:一只胖乎乎的奶龙坐在一座美丽的花园中央,旁边是小池塘、石灯笼和弯曲的小路,周围长满树木,其中包括几棵盛开的樱花树。让整个场景足够震撼、层次丰富,在不同高度和区域布置各种小细节,比如长椅、小桥、石子路、草丛、花坛等,并使用色彩丰富的体素来表现。可以使用任何库来完成这个效果,但要确保我能把所有内容粘贴到一个单独的 HTML 文件中,并直接在 Chrome 中打开。JavaScript 库的引入方式请使用 importmap 和 ES 模块(ESM)导入。”
Gemini 3 Pro 代码写的究极快,十几秒就写完了。虽然它这个奶龙,好像做的一点也不奶龙,但是这个交互,是真的有点过于丝滑了。
我又随手开发了一个台球游戏网球,结果出来以后,当时我就看懵逼了。真的是双人对局啊?物理引擎,玩真的啊???
前端开发案例:网页音乐播放器
Prompt: “做一个模拟黑胶唱片的极致写实的音乐播放器,把音频频谱和节奏可视化成炫酷的图形,功能区在底部,可以调节音量。”
一个还比较好看的网页音乐播放器就做出来了。我上传了一首歌曲,所有的功能都是对的,还有一个非常小的细节,就是当我点击播放的时候,唱臂就会移到圆盘上的位置,显示开始播放。这个细节,很用心了。

前端开发案例:像素画板
做一个像素画板,支持绘制、撤销、导出 GIF,并能“回放”作画过程动画。一次成功!
这些都不是我调了十几轮,来回磨的结果。就是非常简单粗暴的一句话,Gemini 3 Pro 直接给我整个做完了。
图转代码:复刻能力极强
得益于原生多模态,Gemini 3 Pro 的图转代码的复刻能力,真的极强。
比如我想把一个网页的截图,复刻一下。我就可以直接传一张图上去,然后,写上我希望的样式。你静静的等着就好,二十几秒过去,一个前端网页,就开发完了。
区别最大的是字体,原图的字体是类似于 DIN 的有版权字体,而 Gemini 3 Pro,是用了无版权字体替代,所以看着不太一样,还有部分的细节也有点问题。但是,整体的布局、样式,都已经可圈可点了。坦率的讲,我自己曾经也在厂子里合作过不少前端,很多前端开发,能在第一次设计走查时,给你写成这个样子。我一般就直接跪在地上磕头了。。。
还有另一个复刻的案例,比如群友 AI 产品银海的,脑洞是真的牛逼。他说,这个他困扰多年的问题,终于可以解了,直接找到一个普通的图扔进去,复刻成一个可以编辑的前端,就能直接能重排。
最离谱的 Case:生造一个 Windows 操作系统
我随口的一句 Prompt:
“设计并创建一个类似 Windows 操作系统的 Web OS,具备完整功能:从文本编辑器、带 Python 的终端、代码编辑器、可玩的游戏,到文件管理器、画图工具、视频编辑器,以及所有重要的 Windows 系统预装软件。可以使用任意库来实现,但务必确保我能把所有代码粘贴进单个 HTML 文件里,并直接在 Chrome 中打开运行。让整体效果有趣、细节丰富,呈现出超出常人预期的细节,在一个代码块中尽情发挥创意与美感。”
对,你没看错,是直接,造一个类似 window 的 web os,生造一个系统。
这次的代码,写了很久很久,将近 2 分钟。当我点开运行的那一刻,我人又傻了。兄弟,这不对吧???我最开始,以为,这些功能,是装饰,是不可用的。但是结果我发现,这里面大部分功能,都是实现了的,复杂的 vs code 这种确实很难搞,但我还是觉得,卧槽了。。。这一次 Gemini 3 Pro 的能力是惊到我了。
难怪这次,连 奥特曼 都久违的下场,为 Google 庆祝。
Gemini 3 Pro 的出现意味着什么?
我们这一代人,可能刚刚站在了一个非常离谱的起点上。从今天开始,会不会写前端这件事,可能真的没那么重要了。会不会调框架这件事,也没那么重要了。重要的,变成了:
- 你能不能把一个场景,描述得足够具体、足够细节、足够有人味?
- 能不能把那些本来只敢在脑子里想想的东西,翻译成一句一句明确的请求?
- 以及,你是不是有足够的品味?
当我们在这里一边吐槽、一边兴奋、一边跑 demo 的时候,那个未来其实已经慢慢开始往你脚底下挪动了。238 天的等待,值了。所有的不安和嘲笑,在这一刻,都成了最好的背景板。Google,依然是那个 Google。绮灿王道。让我们,开始创造吧。
我认为:Gemini 3 Pro 的出现不仅仅是一个模型的升级,更是一场 AI 时代的革命。它将极大地降低创造的门槛,让更多人能够将自己的想法变为现实。我们正站在一个激动人心的时刻,未来充满无限可能!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
