
新智元报谈
裁剪:元宇
【新智元导读】被Google按了半岁首,OpenAI终于祭出一记反杀。GPT Image 2上线12小时,就登顶Arena文生图榜,跨越Nano Banana 2达241分。Arena官方称,这是Image Arena文生图名次榜迄今最大的分差。
发布今日,三榜通杀。
GPT Image 2上线12小时,Text-to-Image(文生图)、Single-Image Edit(单图裁剪)、Multi-Image Edit(多图裁剪)三个分榜一齐登顶。
Arena官方原话:「a clean sweep」(全胜)。
伸开剩余91%文生图主榜,GPT Image 2 1512分,Nano Banana 2 1271分。241分差距,Arena史上最大。
「莫得任何模子曾以这种差距总揽过Image Arena」,Arena官方默示。
在Image Arena扫数盲测对决中,GPT Image 2的胜率是93%:100张图配对盲选,93张东谈主们选了OpenAI那张。
「要是把DALL-E看作洞穴壁画,把Images 1.0视为古代艺术,那么Images 2.0就是文艺回话」。
OpenAI在发布会开场中这么先容Images 2.0,奥特曼更是将它称作跨代升级:
这能够一下子从GPT-3跃升到了GPT-5。
https://www.youtube.com/watch?v=sWkGomJ3TLI
OpenAI官方API文档对Images 2.0给出了一个最高等的评价。
https://developers.openai.com/api/docs/models/gpt-image-2
但简直的故事,并不在数据里。
被Google压了半年
OpenAI总算扳回一局
时期倒回2025年8月。
Google放出了Nano Banana。这个在Gemini里镶嵌的图像生成模子,在C端短暂引爆。
三个月后的Q3财报会上,Google CEO Sundar Pichai亲口线路了一组数字:Gemini月活,从7月的4.5亿涨到10月的6.5亿。
Google Labs负责东谈主Josh Woodward称,这一增长很猛经过上来自Nano Banana带动的图像生成激越。
11月,Google再发Nano Banana Pro。文本渲染才略惊艳,AI图像第一次能把字写对,OpenAI在C端被反超。
11月18日,Google再补一刀。Gemini 3发布即登顶LM Arena,1501分,首个龙套1500的前沿模子。
这一月底,奥特曼对全公司发了一份「红色警戒」(code red)的里面备忘录。
据The Information报谈,奥特曼暗里告诉职工,Gemini 3可能给OpenAI带来经济顶风。Yahoo Finance后续线路:code red之下,OpenAI暂停了AI Agent等其他产物的研发,资源一齐歪斜到ChatGPT。
12月,OpenAI仓促拿出GPT Image 1.5。Arena第一,但C端没能引爆。
2026年2月,Google再补一刀,Nano Banana 2登场,Arena再度跨越。
OpenAI又输了一次。
一直到4月21日,GPT Image 2上线,OpenAI这才竣事反超,重新扳回一局。
绘制AI将被重新界说
GPT Image 2凭什么能跨越241分?
中枢谜底藏在架构层面。
GPT Image 2不是Stable Diffusion那一代的扩散模子。
OpenAI推敲负责东谈主Boyuan Chen称这是「revamped from scratch」(从零重构)的「generalist model」(通用模子),OpenAI的里面叫法是「图像版的GPT」。
但Chen在press briefing时拒却公开承认它具体是扩散如故自记忆架构。
外界无数把它默契为「带推理规划的图像生成系统」:画之前先规划,再动笔。这恰是GPT Image 2和上一代图像模子最大的不同。
OpenAI在官方确认里给了它一个新标签:首个具备原生想考才略的图像模子(image model with native thinking capabilities)。
画之前先想、画完我方查验、需要时联网搜索尊府、一次能产出8张前后连贯的图。
这不是画笔,是会想考的视觉助理。
Arena榜单分项数据露馅:
翰墨渲染(Text Rendering)单项,GPT Image 2比前代涨了316分;卡通动漫和东谈主像各涨296分;3个产物/3D/写实分类,全体在+247到+277分区间。
翰墨渲染是2025年11月Nano Banana Pro初次科罚的问题,但那时准确率94%。GPT Image 2把它推到了99%。
OpenAI发布会现场演示:让GPT Image 2画一碗米饭,其中只好一粒米上写有模子名字。
具体到才略展示,开云appOpenAI总裁Greg Brockman在我方的X账号上作念了示范。
第一个案例,老相片建立。
祛除发黄的家庭老相片,一个辅导词,坐窝变身高清彩色版。
OpenAI官方API文档里那句「high-fidelity image inputs」(高保真图像输入),说的就是模子对原图细节的保留才略:输入端能精准读取祛除的、糟塌的、无极的老相片细节,输出端才气重新渲染出明晰版。
第二个案例中,Brockman转发了用户@doodlestein的一组测试图:用统一个复杂辅导词让GPT Image 2画一张数学诠释图。
他评价说,即就是复杂辅导词,GPT Image 2也能生成立场相反的图。
@doodlestein 测试GPT Image 2用统一个辅导词画一张线性代数诠释图。模子相接画出4个彻底不同的版块:相通是Mona Lisa+特征向量教授,每个版块的构图、配色、信息密度彻底不同。
这个案例简直价值不在「能画数学图」,而是科罚了畴昔两年中AI生图的一个蹙迫的痛点:输出单一、变体可控性差。
GPT Image 2第一次让「一个prompt给我4个彻底不同的目的」造成了产等第才略。
业内一位LM Arena资深测试者点评谈:
GPT Image 2和Nano Banana Pro之间的差距,跟Nano Banana Pro和DALL-E之间的差距一样大。
跨了整整一代。
GPT Image 2 Thinking模式生成的manga立场漫画页:从一个神圣辅导词启航,模子保捏脚色一致性、铺出多格剧情。
DALL-E退役
Adobe Canva被逼到墙角
发布今日,卑劣器具集成的速率比时刻圈预期的还快。
Figma、Canva、Adobe Firefly、fal、Hermes Agent,一齐在4月21日今日完成集成。
API订价更是守密杀机:
这个差价背后,可能带来2026年图像生成行业最大的产业重构。
5月12日,DALL-E 2和DALL-E 3发挥退役。
它们是2022年开启了通盘AIGC视觉改进的大辂椎轮。三年后,被OpenAI自家的禁受者,亲手送入历史。
OpenAI在官方发布确认里提到:
图像不是荫庇,是谈话。一张好图作念的事和一个好句子一样:选拔、摆列、揭示。
这代表了一种产物形而上学的转向。
天然,也不是莫得反方声息。ZDNet在实测中发现,GPT Image 2无法准确复刻品牌logo,连ZDNet我方的logo齐被画歪了。
Nano Banana 2在portrait realism和multi-reference一致性上仍有上风。
GPT Image 2固然还不够圆善,但赛谈花样依然出现了变化。
渲染时期适度了
推理时期刚运行
Google把推理塞进图像模子里。OpenAI把图像器具塞进推理模子里。242分Elo差距测的就是二者架构上的差异。
implicator.ai的这句评价,鉴别了图像生成的两个时期。
2022到2025年,是渲染时期。
DALL-E、Midjourney、Stable Diffusion,指标齐是「画得像」。模子是画笔,用户是画师,prompt是画稿。
GPT Image 2代表的是一个推理时期。
模子先想考再动笔,能搜索、能自检、能完成任务。它不是画笔,是会画画的助手。
GPT Image 2发布简直巧得疼爱的,是图像生成走向「会想考」这件事自己。
短期看,Black Forest Labs(Flux 2)清贫可能最大。
Kingy AI直言:行为diffusion-first(扩散为先)的厂商,Flux 2的整条时刻活水线在架构上和「token-by-token」的推理道路是冲突的。
要么会通,要么重写,莫得第三条路。
中期看,Google可能会鄙人个季度反击。Nano Banana 3,或者Imagen-Reason,时期不会太久。
长期看,这件事的影响远不啻图像生成。
当AI运行用「想考」来产出图像、视频、音频、代码,通盘生成式AI的范式齐会随着发生变化。
旧年12月,奥特曼在备忘录里敲下「code red」的时候,应该没意象五个月后会以这种面貌回到Arena榜首。
但此次反杀的简直酷爱,可能不是OpenAI赢了Google,而是OpenAI改写了图像生成赛谈的规章。
Arena.AI单图裁剪榜(Image Edit Arena):GPT Image 2 (medium) 仍以1510+分陆续登顶,第二、三、四、五名一齐被OpenAI自家模子和Google Gemini系列占据。https://arena.ai/leaderboard/image-edit
Google下一拳什么时候出?这个问题决定了2026下半年AI花样的走向。
而在那一拳挥出来之前,GPT Image 2会在Arena榜首坐多久,没东谈主知谈。
参考尊府:
https://arena.ai/leaderboard/image-edit
秒追ASI开云
发布于:北京市ag最新app下载官方网站
