加入收藏
黔新网

给出3个词,AI直接作画!OpenAI发布DALL?E2.0,掌握多种画

2022-04-10 18:53:41  来源:IT之家   阅读量:7820   

大家还记得去年 1 月 OpenAI 发布的 120 亿参数魔法模型 DALLE 吗

给出3个词,AI直接作画!OpenAI发布DALL?E2.0,掌握多种画

当时,DALL。E 的画风是这样的:

只要「阅读」文本,DALLE 就能根据文本的内容「自动」生成栩栩如生的大师级画像因此,当时一经发布,DALLE 就火遍了 AI 圈,吸粉无数,也让 Language—Vision方向又火了一把

就在最近几天,时隔一年后,OpenAI 结合 CLIP,又发布了 DALLE 的第二个版本 ——DALL

相比 DALLE 1.0,DALL

比如,当提示文本中分别包含「概念」An astronaut ,「属性」riding a horse和「 风格」in a phtprealistic style时:

文本提示:An astronaut + riding a horse + in a phtprealistic style

DALL。E 2 可以生成如下这些同时包含三种元素的图像:

在满足三种给定元素的基础上,它可是充分发挥了自己的「想象力」,不仅马的姿态各不相同,而且给宇航员穿上了样式各异的服装,场景也是十分丰富,草地上,山顶上,星空中......

神不神奇!牛不牛!

让我们来欣赏 DALL。2.0 的大师作品!

如果你想要变换文本中概念,属性和风格三个元素中的一个或多个,比如保留「概念」一个宇航员和「属性」在骑一匹马,而将超现实主义风格替换为波普艺术家安迪沃霍尔的风格,DALL

文本提示:An astronaut + riding a horse + in the style of Andy Warhol

DALL。E 2 生成的图像:

文本提示:An astronaut + riding a horse + as a pencil drawing

DALL。E 2 生成的图像:

文本提示:An astronaut + lounging in a tropical resort in space + in a vaporwave style

DALL。E 2 生成的图像:

文本提示:Teddy bears + mixing sparkling chemicals as mad scientists + as a 1990s Saturday morning cartoon

DALL。E 2 生成的图像:

文本提示:Teddy bears+shopping for groceries+in the style of ukiyo—e

DALL。E 2 生成的图像:

文本提示:Teddy bears+shopping for groceries+in ancient Egypt

DALL。E 2 生成的图像:

文本提示:A bowl of soup+that is a portal to another dimension+as digital art

DALL。E 2 生成的图像:

文本提示:A bowl of soup+as a planet in the universe+as a 1960s poster

DALL。E 2 生成的图像:

文本提示:A bowl of soup+as a planet in the universe+as digital art

DALL。E 2 生成的图像:

DALL。E 2.0 的其他功能

2,风格变体

原图 1:

DALL。E 2 创造的同一风格图像:

原图 2:

DALL。E 2 创造的同一风格图像:

原图 3:

DALL。E 2 创造的同一风格图像:

原图 4:

DALL。E 2 创造的同一风格图像:

对于 AI 从文本生成的图像,我们非常看重的一点当然是图像的分辨率了,图像的分辨率越高,像素数量就越多,图像也就越清晰和逼真与 DALLE 1 相比,DALL

比如,对于同样的文本提示:

文本提示:a painting of a fox sitting in a field at sunrise in the style of Claude Monet

下面两张图分别是 DALLE 1 和 DALL

对比之下,DALLE 1 生成的图像可以说是很模糊了,甚至根本看不出「日出」在哪里,「狐狸」只显露出它的头部,「田野」也不太有田野的样子,而且在整体风格上与画家莫奈的印象派风格相去甚远

而在 DALLE 2 的魔法手笔下,图像质量显著提高,「日出」和「田野」都很生动,小狐狸端坐在草地上,姿态可爱这幅画作色彩更加丰富,使用了更多的复色,对光影的描绘更加接近莫奈的风格

总体来说,相比 DALLE 1.0,DALL2 显然能 hold 住元素更丰富,色彩更饱满的图像

更详细的内容,可以查看 DALL。E 2 的相关研究论文:

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。