就在这周,OpenAI连续放了两个大招。4月21日ChatGPT Images 2.0上线,4月23日GPT-5.5正式发布。表面上看一个是模型升级,一个是生图升级,但把它们放在一起看,味道就完全不同了。
GPT-5.5:真正的”打工AI”来了
这次GPT-5.5的定位很明确——一个更适合真实工作的模型。什么叫真实工作?不是陪你聊天,而是能接一个乱糟糟的任务,自己拆步骤、自己用工具、自己检查结果。这就是OpenAI一直在说的Agentic AI(能自己规划和执行任务的AI)。
官方公布了三组关键数据:
- Terminal-Bench 2.0:82.7%——看AI能不能在命令行里完成复杂任务,装依赖、跑脚本、调错误都算
- SWE-Bench Pro:58.6%——看真实GitHub问题修复能力,别只会写样例代码,要能修真实项目的坑
- GDPval:84.9%——偏知识工作,做表格、写文档、分析数据、处理办公室任务
还有一个细节:同样任务GPT-5.5用的token更少,意味着更快、更省钱、而且不容易在长任务里跑偏。
Images 2.0才是真正的大招
如果只盯着GPT-5.5,很容易写成各种模型对比榜。但真正值得普通人关注的是ChatGPT Images 2.0,因为它开始能做可交付的视觉资产了。
官方重点强调了三个改进:
- 文字渲染更稳——以前AI画海报经常把字画成鬼画符,现在能直接生成海报、信息图、商品图。字一错,设计再漂亮也不能用,这个问题终于解决了
- 指令跟随更强——让它保留构图、改风格、控制比例,它更能听懂。对做产品页、活动海报、汇报插图很关键
- Thinking Mode来了——不是立刻出图,而是先理解任务、必要时搜索资料,再生成图片。换句话说,它开始会”想”怎么画
为什么这两个放一起看才是王炸?
以前AI工具是断开的:你让AI写营销方案,它能写,但做封面、做海报还要切到别的工具。你让AI分析产品,它能分析,但做汇报图还要人工排版。
现在OpenAI把这条路打通了:前面GPT-5.5负责规划、研究、写代码、做表格,后面Images 2.0负责把结果变成图。这不是模型分数高了0.7个百分点,而是ChatGPT越来越像一个完整工作台。
对普通人有什么实际影响?
第一,汇报图门槛变低
以前做PPT配图最大的问题不是画不出来,而是文字不好看、版式不稳定、中文经常翻车。Images 2.0如果能稳定解决文字和版式问题,周报封面、产品海报、项目复盘图都能省大量时间。
第二,信息图开始真正有用了
AI生图以前最适合做氛围图,好看但不一定能用。这次官方强调小文字、图标、UI元素、密集构图——盯上的不是艺术图,而是信息图、流程图、产品说明图。以后模型对比、价格对比、功能路线图可以直接做成图。
第三,一个方案可以变成多种物料
方案写完不只是丢进文档,还可以让ChatGPT生成客户介绍图、培训图��活动预告图、产品说明图。每篇文章天然多了几种分发形态。
使用建议
产品经理:拿功能说明文档测试,第一步让GPT-5.5提炼3个用户痛点,第二步生成产品介绍结构,第三步用Images 2.0生成产品说明图和对比图。
运营/市场:拿活动方案试,让GPT-5.5拆目标人群和卖点,再让Images 2.0生成活动海报和话术图。
开发者:重点看GPT-5.5的Codex能力(长任务、调试、测试、重构),Images 2.0可以用来做README图、架构图。
需要注意的问题
- 官方示例不能等于真实效果,发布会展示的图都是挑过的
- 版权和商用边界要谨慎,能生成不代表每个场景都能放心用
- 高质量模式可能不便宜,官方说API还没全面开放
真正值得看的是:OpenAI开始把模型能力和内容交付能力接到一起。以前我们用AI是问一个问题,后来是写一段代码,现在变成了:给它一个目标,它自己查、自己写、自己做图、自己交付。路走通之后,很多人的工作形态一定会变。
信息来源:老金AI公众号文章
© 版权声明
文章版权归作者所有,未经允许请勿转载。
