
GPT Image 2 的发布给通盘 AI 圈带来了亿点点轰动。
但好多东说念主可能没驻守到,幕后最会玩梗的竟然是他——主力磨砺者陈博远。
他和奥特曼同台主捏,暗暗修好了中语渲染;给模子起代号"布基胶带",还拿香蕉艺术品玩梗;为了秀模子的笔墨才略,遐想了米粒刻字、漫画套娃、视觉领略题这些"彩蛋级"测试。
这篇共享里,他把官网展示图片的幕后花絮全抖了出来,又可笑又细节控狂喜。
本文经授权转载,以下为原文:
人人好,我是 GPT Image 团队的磋商科学家陈博远。上周发布的 GPT 生图模子等于我主力磨砺的!
此次终于轮到我和奥特曼通盘主捏发布会。很欣喜此次修好了模子的中语渲染!淌若人人有什么响应不错径直回话我哦。
图 1 中是我在发布会上的直播(不外多谈话才略是直播后半节,国内媒体不祥并莫得发现只好我才是国东说念主 QwQ)。此次挑升用图片生成了通盘官网 blog,背后有好多花絮很好玩。

△陈博远在 OpenAI GPT Image 2 发布会上和山姆奥特曼演示笔墨渲染才略
咱们的模子在发布前用 duct-tape 的代号在 LMArena 上进行了双盲测试。这个代号亦然我起的,根由是布基胶带,也等于底下这个东西:

△duct tape 翻译过来叫布基胶带,不外国内不常见
至于为啥起名叫布基胶带嘛 .. 虽然是因为你不错用布基胶带把香蕉贴在墙上啦!

△那幅宇宙闻明的艺术品,等于用布基胶带把香蕉贴在墙上
虽然,抑遏亦然在双盲测试中断崖率先了代号为小香蕉的第二名。

除此除外我花本事作念了好多咱们官网上的图片。通盘 Blog 都是用图片生成的,王人备莫得文本。
底下这些图都是我亲手作念的!每张图的背后都有好多想考,这里也像艺术家相通和人人展示下。

然后是咱们的中语彩蛋。
那时异常想作念一个很搞笑的漫画,于是意想了接住梗和香蕉梗。虽然,为了秀一下笔墨才略,我挑升让他用多国谈话加了好多笔墨,而况家乡海报的右下角让他生成异常异常小的中语来测试到底能多细节。
我为了让模子作念一些只好咱们才作念得到的事情,开云官方体育app挑升让它生成的图要看起来像是一张对着一册的确漫画书拍的像片。
这整张图,包括画中画和画中画中画都是一次性生成的。我遐想完以后悲痛人人以为这是张拼接图,于口角凡在图底加了备注。

想来想去,这样的笔墨渲染其实依然不够惊艳。
在队友的教唆下我作念了一张 4K 图(为了省俭人人的流量压缩了小数点)。实质是一堆米粒,然而其中的一颗上头刻着字。你能找到吗?


这张日语漫画亦然我作念的。
那时想作念一个和 GPT 图片生成关连的漫画。那时作念了一张和香蕉关联的巨搞笑的漫画,然而嗅觉放在官网上不太相宜。于是终末依然用了另一种神志把漫画和 GPT 生图揣测在通盘。
我构想了羽羊毫这个主题,剩下的只好很浮浅的教唆词,告诉他构想"戏剧化"的漫画。

更多杂志页,这张是和共事通盘作念的。想路是让生图模子用一些着实的物体王人集艺术的布局。这样既不错体现模子的对着实宇宙的归附,又不失遐想感。

作念底下这张图的时候,我在意想底有什么东西能越过咱们模子在想考才略上的逾越。
淌若让他解平凡数学题方程啥的,似乎就太浮浅了。Nano Banana 似乎通过想考情状 + 笔墨渲染的神志也能作念。
于是我意想了我异常可爱的一个视觉领略来信得过熟识 GPT Image 2 特有的视觉推理后果。
图里教唆词说的是,在黑板上用视觉(而不是代数)领略从 1 运行的奇数之和是一个曩昔。平凡的模子其实很容易推理出代数解,然而图形解只好视觉模子才智作念了。

终末这张图展示的是搜索才略,要去咱们官网的商店里找实质作念一个海报。
直播里咱们还展示了 Thinking mode 自动生成二维码放进图片里,其实背后有个彩蛋,那时展示的二维码扫进去的前些许个东说念主不错赢得一个免费小奖品。

终末的终末依然要感谢团队的王人心合力!每个东说念主都作念了好多好多的事情。
在发布前的尾声,我除了在修一些小东西等于和阛阓部门的共事还有作念艺术的共事通盘准备发布会和这个网站,他们的确是我见过的最众多的合营者了,也让咱们终末才有了这样漂亮的网站。
但愿这回稳稳地接住了人人!
《我在 OpenAI 修中语》:
https://zhuanlan.zhihu.com/p/2033191141806437343
— 宽宥 AI 产物从业者共建 —
� �「AI 产物常识库」是量子位智库基于永恒产物库跟踪和用户举止数据推出的飞书常识库,旨在成为 AI 行业从业者、投资者、磋商者的中枢信息重要与有规画维持平台。
一键柔柔 � � 点亮星标
科技前沿弘扬逐日见开云
米兰体育官方网站

备案号: