编辑:编辑部
【新智元导读】Prompt不存在了?DALL·E 3忽然合并进ChatGPT,作图精准,细节逼真,OpenAI今天真的炸翻了AI绘画圈。
早上醒来,AI绘画圈已被炸翻。
OpenAI丢下一枚重磅炸弹——合并ChatGPT的DALL·E 3,官宣了!
一个是史上最强大语言模型,一个是史上最强文生图模型,二者一合体,势必要颠覆整个AIGC圈。
经过最强变身后的DALL·E 3,能够理解语义的细微差别,细节逼真到可怕。
Prompt:「一幅鳄梨坐在治疗师椅子上的插图,说『I just feel so empty inside』,中间有一个坑大小的洞。治疗师,一把勺子,涂鸦笔记」
网友惊呼:「如果DALL·E 3真的能准确呈现图像中的文本,那么它将彻底改变游戏规则!!!」
同时,prompt的门槛,也大大降低。
「语死早」的用户,再也不用担心写不出华丽丽的提示词。给个提示,ChatGPT就给你写出洋洋洒洒的段落。
总之,你可以尽情展开想象,让ChatGPT带你飞!
再也不用绞尽脑汁去思考如何prompt了!仅仅和ChatGPT对话,就能妙笔生花
甚至,你还可以在对话过程中,基于生成的图像随时做出修改。
可以看出,为了赶在谷歌发布多模态Gemini前夜,OpenAI先下手了。
英伟达高级AI科学家Jim Fan兴奋表示,这就是大规模多模态LLM与谷歌Gemini史诗之战的提前预演!
OpenAI CEO Sam Altman也在评论区得意地表示:「We are so back」。
目前,DALL·E 3还在内测中,预计将在10月上旬向所有Plus用户和企业用户推出。
Midjourney劲敌真来了!
DALL·E 3的独特之处在于,它是在ChatGPT上原生构建的。
只需向ChatGPT提出要求,一个简单的句子,或者一个详细的段落,它就能开启头脑风暴,改进提示。
英伟达顶级科学家Jim Fan表示,这太震撼了!
DALL·E 3的意义在于,它不仅是Midjourney的强劲对手,更代表着多模态大模型之战的一触即发。
DALL·E 3的卓越语言匹配能力,是建立在坚实的文本GPT基础之上的。Midjourney其实并没有多少「推理大脑」,这就是为什么需要这么多的提示黑客。
先有大脑,再有像素,这就是构建强大多模态人工智能的方法。
不用学提示工程,你只管天马行空。提示词,ChatGPT帮你代笔,而精美画作细节,就由DALL·E 3承包了。
下面这个例子告诉你,DALL·E 3生成如下一幅画时,是如何详尽地将文字中的每一个场景,栩栩如生地刻在画中,画质仿佛电影一般。
一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。
街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。
这个老板身材高大魁梧,身穿笔挺的西装,留着引人注目的山羊胡,正用他那部复古蒸汽朋克风格的电话兴致勃勃地交谈着。
另外,在同一个提示下,比起DALL·E 2,DALL·E 3绘出的图像会更加精准。
比如,「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula」,DALL·E 3在人物、篮球、更宏观背景生成上更加详细。
从网友做的对比图中可以看到,DALL·E 3和DALL·E 2之间的差距,可以说是史诗级的。
网友表示,OpenAI这次绝不仅仅是为了超越Midjourney。谷歌才是他们最大的竞争对手,尤其最近Gemini一直箭在弦上。
有人说,这种变化体现了AI作画工具的一个重要演进趋势:听懂人话。
如果AI能让我们更好地描述和修改图像,那就太好了!DALL·E 3能走多远,让我们拭目以待。
DALL·E 3+ChatGPT
DALL·E 3+ChatGPT,有多惊艳?
Altman在一段宣传视频暗藏了DALL·E 3生成的可爱细节。
DALL·E 3能够把一个5岁孩子的幻想,变成现实。
「我家5岁宝宝一直在说一个「超级向日葵刺猬」,它该长什么样?」
ChatGPT自动根据4个不同提示词,生成了不同的风格的图像。这里选择了最后一张,就可定下继续创作的基图。
接下来,给小刺猬起名Larry,并为它画一个房子。
可以看到,DALL·E 3不仅准确理解了要求,而且还能够在图片中标注文字,在一个邮箱上面有「Larry」。
完全解决了,之前DALL·E模型完全不会写字的难题。
你还可以边画,边完善故事情节,甚至还能为其配上插画。
另外,DALL·E 3还可以根据以上风格,生成可爱的贴纸,
最后,让ChatGPT总结上上述内容,再生成一个睡前故事,简直绝绝子。
OpenAI官方,也给出了一大波精美图集。
prompt:这是一件纸艺作品,描绘了一个女孩温柔地拥抱猫咪。她们都坐在盆栽中,猫满足地打着呼噜,女孩则面带微笑。场景中点缀着手工制作的纸花和纸叶。
A paper craft art depicting a girl giving her cat a gentle hug. Both sit amidst potted plants, with the cat purring contentedly while the girl smiles. The scene is adorned with handcrafted paper flowers and leaves.
DALL·E 3可以制作精美海报,还能配上文字。
prompt:金星复古旅游海报,纵向。画面描绘了金星周边围绕着厚厚的淡黄色云层,以及一艘老式火箭飞船驶近的剪影。神秘的形状暗示着云层下的山脉和山谷。底部文字为「探索金星:迷雾背后之美」。配色方案由金色、黄色和柔和的橙色组成,唤起人们的好奇心。
A vintage travel poster for Venus in portrait orientation. The scene portrays the thick, yellowish clouds of Venus with a silhouette of a vintage rocket ship approaching. Mysterious shapes hint at mountains and valleys below the clouds. The bottom text reads, Explore Venus: Beauty Behind the Mist. The color scheme consists of golds, yellows, and soft oranges, evoking a sense of wonder.
prompt:这幅插画描绘了一颗由半透明玻璃制成的人心,矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上碑座镌刻着一行醒目的大字 「寻找你内心的宇宙」。
An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote Find the universe within you is etched in bold letters across the horizon.
prompt:这是一张暴风雨天放在窗台上的咖啡杯的3D效果图。窗外的暴风雨倒映在咖啡杯中,杯内可见微型闪电和汹涌的波涛。室内光线昏暗,更增添了戏剧性的气氛。
A 3D render of a coffee mug placed on a window sill during a stormy day. The storm outside the window is reflected in the coffee, with miniature lightning bolts and turbulent waves seen inside the mug. The room is dimly lit, adding to the dramatic atmosphere.
prompt:一幅详细的油画,描绘了一位老船长,驾驶他的船穿过暴风雨。盐水溅在他饱经风霜的脸上,眼神坚定。在上方可以看到旋转的邪恶云层,严厉的海浪威胁着淹没船,而海鸥则在混乱的景观中潜水和旋转。远处传来雷声和灯光,将现场照亮,发出诡异的绿色光芒。
A detailed oil painting of an old sea captain, steering his ship through a storm. Saltwater is splashingagainst his weathered face, determination in his eves. Twirling malevolent clouds are seen above anostern waves threaten to submerge the ship while seagulls dive and twirl throuah the chaoticandscape. Thunder and lights embark in the distance. illuminating the scene with an eerie green glow.
Midjourney弱爆了
消息一出,网上很快就出现了一波和Midjourney的对比图。
同样的提示,Midjourney和DALL·E 3,简直不在一个级别上。
还有,SDXL和DALL·E 3生成对比图。
还有网友称,自己用Raw Midjourney、Non-raw Midjourney以及DALL·E 3用同一个提示生成图。
还有网友做出出了更多Midjourney和DALL·E 3 PK图。
全新原型,代号「Gizmo」
与此同时,网友「Tibor Blaho」还爆料称,OpenAI正在为ChatGPT开发一款代号为「Gizmo」的全新原型——
它有着更新的UI界面,并为企业客户引入了强大的「Gizmo编辑器」,允许用户创建自己的「GPT」。
具体来说,你可以为自己的GPT定义个人资料图片、模型(GPT-3.5或GPT-4)、能力(包括DALL·E、网页浏览、编码沙盒、插件等)、已启用的插件列表、行为(这个GPT是什么,它做什么,它应该知道什么)、欢迎消息(当用户与这个GPT开始新的聊天时,它应该说什么),并决定这个GPT是不是私有的。
参考资料:
https://openai.com/dall-e-3