今天正式发布了:
https://openai.com/index/introducing-chatgpt-images-2-0/
效果…非常赞啊。
只需要极短的 prompt,就可以生成非常高质量的图片,而且很多图片,越来越感受不到是 AI 生成了,足以以假乱真。
来看一些 DEMO:
中文漫画:
[!info] Prompt
为即将发布的 ChatGPT Image 2 模型生成有关这位 OpenAI 研究科学家陈博远(第一张图片)的全彩中文文字漫画。(背景是波霸茶和用胶带粘在墙上的香蕉)。当他尝试在电脑屏幕上生成一些详细而精美的多语言信息图表手绘风格海报,介绍他的家乡-- 无锡时,该模型可以呈现小到令人难以置信的中文文字。他的辛勤付出得到了回报,他的模型能书写所有语言,其多语种文本质量之高令人咋舌,给团队留下了深刻印象。当他一只手拿着手机休息的时候,他的手机收到了山姆-奥特曼(Sam Altman,头像附在第二张图片中)发来的翻译短信,请他看一下他刚刚生成的图片中渲染的多语言文本,以向团队表示祝贺,因为山姆只懂英语。然而,让博源在最后看到山姆生成的图片的中心位置包含了一个 "稳稳地接住你 “的短语(典型的漫画风格)来搞笑,因为这句话已经被 GPT 作为一个不自然但有趣的中文句子在中文互联网上流行开来。博源应该怒斥 “天呐!它又学会了接住!”(天呐!它学会又学会了接住!”)。在漫画的最下方,用中文加上一行小脚注(非常小):"注:整幅漫画,包括本脚注和图中图,均由 gpt 图像 2 一次生成,未经编辑或多步骤生成。
附加说明
[!info] Prompt
附加说明:使用竖排 1440x2560 图片布局,第一行是这位研究员努力工作的画面,第二行是他用多种语言在 无锡取得成果的画面,第三行是团队兴奋的画面,第四行分为左右两部分,左侧是他休息和手机收到信息的画面,右侧是 Sam 的短信,第五行是 Sam 的照片和陈博远的反应。除第一行外没有旁白。避免使用中文地图。所有字符都应采用漫画风格。香蕉背景应只出现在第一幅,胶带应为单片胶带,而不是交叉胶带。香蕉和胶带的装饰应该很小,就像一个不起眼的复活节彩蛋。OpenAI 徽标只能出现在陈博远的衣服上,不能出现在其他地方。场景中不能出现杯子,因为我们已经有了波霸。Sam 只应出现在文字信息面板中。整部漫画应该以漫画书实体页面的专业照片形式出现。在海报的最右下角有一个小的 “极小中文也清晰可读:”,上面有一段更小的中文,开头是"很多年没回家了,好想吃大闸蟹啊!"(此处为极小字号测试)无锡是作者的故乡,所以做了这幅海报,中文总算是修好了。
随手拍
[!info] Prompt
在一个阴霾的早晨,一个人站在沿海路边的岔路口,用 35 毫米胶片拍摄的逼真的旅行场景。自然不完美的取景、明显的颗粒、环境光、柔和的色彩、衣服和头发上的风,电影般的真实感,以及生活纪实照片的感觉。
报告厅照片
[!info] Prompt
2015 年的 UBC 大讲堂,教授正在播放关于 GPT 图像生成 2 的幻灯片,逼真。幻灯片显示教授正在播放关于 GPT 图像生成 2 的幻灯片,如此反复,永无止境。
外星人
[!info] Prompt
这是一张逼真的 iPhone 照片,照片中两个外星人坐在午后的露天咖啡馆里,由同桌的人随手拍下。喝了一半的饮料、不均匀的阳光、放松的姿势、略微不完美的取景,以及日常手机快照的自然真实感。
角色扮演
[!info] Prompt
根据你对我的了解,为我制作一份动漫人物角色表,我的名字叫 adele
国画
[!info] Prompt
Traditional long Chinese 山水画.Aspect ratio:横向 3:1
对角线信息图
[!info] Prompt
坎托对角线证明,信息图表
勾股定理证明
这是我做的 画一张勾股定理的证明图:
色彩分享
[!info] Prompt
利用这幅肖像画,创建一个以图为先的个人色彩分析。通过视觉对比,说明哪些服装颜色适合被试。尽量减少文字,避免段落。
广告
[!info] Prompt
制作一个广告,宣传我在成都九眼桥新开的名为’Appinn’的抹茶店。要有草莓抹茶(冰的)的漂亮阳光图片和日本极简主义的街头美学。确保包含多种宽高比输出,这样我就可以在 twitter、IG 故事、IG feed 和 Linkedin 上使用它。
可视化证明
[!info] Prompt
这是一张 35 毫米胶片照片,拍摄的是教室里的一块黑板,黑板上是奇数之和为正方形的直观证明。数学证明前有一个标题 “思维模式开启”。纵横比:4:5 纵向。
Adobe Firefly 产品高级总监作品
[!info] Prompt
无人机拍摄的电影镜头,直视海岸边一排排粉色汽车旅馆,每个旅馆都有一个小游泳池,散发着绿松石和水蓝色的柔和光芒。这些建筑在阳光下褪去了粉色、桃色、薄荷色和薰衣草色,几何形状干净但略显破旧。泳池像玻璃一样闪闪发光,有的完全静止,有的轻轻荡漾,反射着温暖的金光。几把空躺椅和遮阳伞整齐地摆放着,一尘不染。画面静谧而悬浮,朦胧中略带曝光过度的光晕、细微的胶片颗粒和柔和的镜头光晕洗刷着画面。阴影在人行道上柔和地延伸,一切都让人感觉既真实又梦幻–怀旧、亲切,还有一点超现实,就像从高处看到的记忆。写出汽车旅馆的名字:萤火虫汽车旅馆、萤火虫小屋、萤火虫旅馆、萤火虫之家。将一些游泳池做成圆形,一些做成菱形,一些做成长方形。
支持在 Codex 中使用
无需单独的 API,直接在 Codex 中使用。
ChatGPT Images 2.0 从今天开始向所有 ChatGPT 和 Codex 用户开放。ChatGPT Plus、Pro 和 Business 用户可使用带思维的高级输出。
局限性
ChatGPT Images 2.0 是一项重大进步,但并不完美。对于需要完整连贯的物理世界模型的任务、折纸指南、魔方等谜题,以及需要在隐藏、倾斜或反转的表面上正确显示的细节,它仍有困难。标签和图表可能仍然需要审查其准确性,特别是当它们依赖于精确的箭头或部件标签时。我们将这些限制视为未来工作的重要前沿。














