Images 2.0是一次质的飞跃,它在精准听懂长指令、精确摆放并理清物体间关系、衬着密集文本方面有了巨大年夜冲破。

最重要的是,它是首个具备“思虑才能”的图像模型,可以联网搜刮及时信息、二次自检。

它还能一次性直出八张风格连贯的图,最高支撑2K超清分辨率。

这么说吧,Images 2.0的出世,从新定义了视觉生成的统治力——

多说话质变:中日韩等非拉丁文字精准衬着,不仅字拼得对,语句也通顺连贯;

风格成熟:照片级逼真感,片子剧照、像素艺术、漫画等视觉说话都拿捏得住;

会思虑:首个具备推理才能的图像模型,能联网搜刮、自检输出,常识更新至2025年12月。





文字衬着翻车、多说话拉胯、风格一模一样、构图一眼AI,这些痛点每一个都劝退了想把AI图像用在正经场景里的人。


在Arena最新榜单中,Images 2.0一骑绝尘,登顶全球AI生图王座。实力暴击GoogleNano Banana 2/Pro版本,领先242分。

它在全部7个文生图类别中,全部位列第一。



最狠的是,它可以做到像素级生成。

直播中生成的一张米山图,个中的一颗大年夜米粒,竟刻上了“GPT image 2”的字体。


奥特曼还秀了一番,和4o图像负责人Gabriel Goh一路更多GPU的漫画图。


一次生成八张连贯画面



闪光灯过曝、稍微活动模糊、角落里印着“02 18 04”的橙色日期戳,所有“胶片时代的不完美”都被精准复现。


网友们纷纷上手,被Images 2.0的实力再次惊艳到了。

甚至,有人表示,“OpenAI终于再次引领图像生成范畴”!



中文直接封神

OpenAI本身玩梗“稳稳地接住你”

以前的图像模型,英语和拉丁字母说话表示尚可,一碰着中日韩文字就开端“鬼画符”。

个中最颠覆性的进级,全部藏在“思虑模式”里。

OpenAI研究科学家陈博远亲自出镜(很可能也是他本身写的prompt),生成了一整页全中文彩色漫画,讲的是他在OpenAI做ChatGPT Image 2中文文本衬着优化的故事。

此次,官博里放出的中文Demo,直接炸了。


这张图同时证清楚明了三件事,中文文本衬着才能质变、极小字号的精度控制、以及复杂多面板漫画的一次性生成才能

漫画分五排,第一排是陈博远在电脑前专一工作,背景里有珍珠奶茶,墙上用一条胶带粘着一根喷鼻蕉(致敬艺术圈名排场)。

第二排是他为故乡无锡生成的多说话手绘风格信息图海报,上面密密麻麻的中文小字全部衬着精确。

第三排是团队看到后果后集体高兴的排场。

第四排画风一转,陈博远拿着手机歇息,收到了奥特曼发来的一条翻译短信,祝贺团队的中文衬着成果。

然后,重头戏来了。

第五排,陈博远看到奥特曼生成的那张祝贺图片,中心地位赫然写着一句“稳稳地接住你”。

懂的都懂。


照片级逼真感

GPT在中文对话中动不动就“我会稳稳地接住你”“你的感触感染是合理的”,那股子油腻又真诚的美式心理咨询味,被中文用户猖狂吐槽了大年夜半年

漫画里的陈博远当场破防,漫画式暴怒大年夜喊“天呐!它又学会了接住!”,旁边的队友们化身小脑筋冒盗汗,弱弱地说“我们正在尽力修复它!”

这波自嘲,可以给满分。(手动狗头)


中文之外,OpenAI还放出了全日语对白的少年冒险漫画、涵盖印地语、孟加拉语、泰卢固语等九种说话书本封面的印度书店,以及韩语高等韩屋住宿告白。

说话不再是图像生成的“二等公平易近”了。



像素级生成

GPT-3到GPT-5大年夜跨越

从今天起,所有ChatGPT、Codex都可以用上ChatGPT Images 2.0。

ChatGPT Images 2.0可以称之为OpenAI生图的下一个里程碑宣布。

直播中,奥特曼将其称之为,“这种感到就像是一会儿从GPT-3直接跃升到了GPT-5”。

上传一张四人合照,ChatGPT直出一张杂志封面,在页面设计、文字排版都异常讲究。

并且海报中,包含了海量的细节,小字的处理,人物面部一致性,给人一种“男团”的即视感。



在细节方面,ChatGPT输出完全达到了“照片级”后果,逼真到让人看不出是AI生成的。

比如下面这张,穿越回2015年OpenAI刚成立那年,阶梯教室光线情况、PPT案牍让人震动。


把ChatGPT生成的图片扔进全景查看器,便可以实现如下的后果,太阳的地位、影子的偏向,以及一些细节全部清楚可见。


官方放出的Demo里,有一张macOS浏览器中ChatGPT窗口的截图。

窗口层叠、终端在后台打开、桌面混乱无章,视觉细节多到离谱,生成出来的后果几乎和真实截图一模一样。


AI生成的图终于不像AI了

风格逼真度是另一个大年夜跃进。

以前AI生成的图片,总有一种说不出的“AI感”,皮肤太滑腻、光线宁靖均、构图太完美,一眼就能看出不是真人拍的。

Images 2.0反其道而行之,开端学会“不完美”。

官方Demo里有一组抓拍快照,35mm胶片质感,可见颗粒感,构图略微偏离中间,衣服和头发在风中飘动。

假如不告诉你是AI生成的,你会认为这是某个摄影师在公路旁顺手按下快门的成果。


还有一组一次性相机风格的照片,模仿的是2000年代初美国高中电脑室的场景,学生们挤在米色CRT显示器前用ChatGPT。


在风格多样性上,Images 2.0也拉开了差距。

宽高比如今支撑最宽3:1、最高1:3。为此,OpenAI专门放了一张横版中国传统长卷山川画,文字晕染和留白都有模有样。

1960年代法国新海潮片子海报、装潢艺术风格书签、动漫角色设定图,每一种视觉说话都保持了高度的风格一致性,而不只是“看起来有点像”。



会思虑的图像模型

现场直播中,ChatGPT图像负责人Gabriel Goh表示,Images 2.0一共上线了两种模式——

即时模式(Instant Mode)

思虑模式(Thinking Mode)

当在ChatGPT中选择思虑模型时,Images 2.0不再只是一个“你说我画”的衬着器,而是变成了一个视觉思虑伙伴。

它会花更多时光懂得你的意图,搜刮收集获取及时信息,对图像构造进行推理,然后再动笔。

像素级精度:小字号文本、图标、UI元素等复杂细节一键生成,支撑3:1到1:3全尺寸输出;

只需上传一张大年夜头照,ChatGPT就能急速给出八套夏装搭配。选择个中一套,还会为你生成更多衣服不合角度的细节。




在这个义务中,ChatGPT调用了两种不合的“视觉智能”:

起首是“视觉懂得”才能,它要逼真地去“看”照片。懂得一小我的样貌,然后筹划出合适的服装搭配筹划。

另一个维度则是“视觉生成”才能。它须要把筹划好的服装构造,转化为一张连贯且有层次的图片。

以前想做一组社交媒体素材,你得一张张生成,本身拼接。如今一句prompt,Twitter、Instagram Stories、Instagram Feed、LinkedIn四种尺寸一次性出齐,色调和构图风格同一。

官方Demo展示了一家布鲁克林抹茶店“kizuki”的告白素材,冰镇草莓抹茶在阳光下的画面,街头服饰美学搭配日式极简,四种社交平台尺寸一步到位。


还有一个学术论文海报的Demo,直接上传PDF,模型主动提取关键图表、数据和构造,排版成一张横版海报。


值得一提的是,Images 2.0开启思虑模式后,还可以直接联网搜刮信息。

团队泄漏,几天前在Arena盲测的“DuckTape”就是今天的Images 2.0。



ChatGPT、Codex全线开放

真正让全场惊掉落下巴的,是一张人类登月的360°全景图。

带有“思虑”过程的图像生成功能,已向ChatGPT Plus、Pro、Business用户开放。底层模型gpt-image-2也已在API中上线。


在订价方面,ChatGPT Images 2.0更强了,同时toekn输入/输出价格没有涨。


对通俗用户来说,演示文稿配图、社交媒体海报、产品宣传卡片这些以前要开Photoshop折腾半天的活,如今一句prompt搞定。

对开辟者和企业来说,本地化告白、多说话信息图、教导内容、设计对象这些须要大年夜量人工的视觉工作流,如今都可以经由过程API批量主动化了。

Codex里更是把图像生成整合进了工作区,设计团队可以在同一个情况里出UI筹划、比选项、转产品,全程不消切换对象。

然后,他们让Images 2.0汇集网友反馈,并制造成一张图。没想到,模型还生成了一个可直接扫描的“二维码”。


更关键的是,思虑模式下它可以一次性生成最多八张风格连贯、角色一致、内容递进的图像。

图像生成的iPhone时刻?

回头看,从DALL·E到Midjourney到Stable Diffusion,AI图像生成一向处在“够用但不太行”的状况。

Images 2.0一口气把这些短板全补上了,还加了思虑才能和多图一次性生成。

固然它离“完美”还有距离,但它可能是第一个让设计师、营销人员和内容创作者认为“这器械我真的可以用在工作里”的AI图像模型。

如今,设计师们可能要从新想想,本身的护城河到底在哪里了。

参考材料:

衬着精度到了这个级别,解释模型对图像中每一个像素的控制力已经跨过了一个临界点。

https://x.com/OpenAI/status/2046661795327459677

https://x.com/OpenAI/status/2046670977145372771

https://openai.com/index/introducing-chatgpt-images-2-0/

https://x.com/sama/status/2046672912833458597

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部