「文章来源:David Gewirtz, Senior Contributing Editor」 今天是万圣节,这就是我们的主题。让我们以传统方式进行一场AI绘画对决吧。我们将在八个图像对比测试中,将ChatGPT中的DALL-E 3与Midjourney进行对比。每个提示词都包括一种艺术或展示风格和一个要创建的图像。最后,我将总结结果并宣布一个胜利者。现在,让万圣节AI对决开始吧!「Photorealistic, 35mm, friendly cheerful witch, in doorway of suburban house, giving away treats on Halloween」(逼真的35mm友好开朗的女巫,在郊区房屋的门口,在万圣节时分发糖果)Midjourney没有满足规定,它没有在任何图像中提供糖果。它们都有些奇怪。在第4张图中,女巫手里拿着什么?是手机、剃须刀还是三角扫描仪?绝对不是糖果。 DALL-E 3做得更好。它的四个提交都有糖果,尽管拿着饼干的女巫可能不是提供实际的不给糖就捣蛋式的糖果。「1960s style cartoon, the great pumpkin halloween, with happy Snoopy-like dog」(20世纪60年代风格的卡通,伟大的南瓜万圣节,有一只开心的类似史努比的狗)我必须承认,DALL-E的表现让我感到惊讶。DALL-E没有生成类似史努比的狗,它几乎就是生成了史努比。DALL-E的图像#1甚至在背景中有一个查理·布朗。另一方面,Midjourney确实生成了小白狗,尽管其中的南瓜没有一个足够大被认为是一个伟大的南瓜万圣节。在这一轮中,我必须选择Midjourney。DALL-E生成了史努比的卡通,但是因为它如此精确地生成了史努比的卡通,包括背景中的查理·布朗,所有四个条目必须被取消资格,不能在没有许可的情况下使用。「8-bit Halloween vampires, mummies, Frankenstein monster costumes」很明显,DALL-E遵循了规定,生成了8位图像,就像从8位视频游戏中提取出来的一样。另一方面,虽然Midjourney的#3满足了这个标准,但它生成的图像严格来说并不是8位图像。相反,它创造了受到8位风格启发的图像。从技术上讲,DALL-E赢得了这一轮。但我对Midjourney的结果更加着迷。我将这一轮给了DALL-E,因为它符合了技术要求。但我更喜欢Midjourney。「Photorealistic style, Graciela Iturbide style, haunted Halloween house mansion」(逼真风格,Graciela Iturbide风格,闹鬼的万圣节房子庄园)我在提示中使用了特定艺术家的风格。Graciela Iturbide是一位墨西哥摄影师,她以相当鲜明、高对比度的黑白风格捕捉家庭生活场景,我认为这种风格可能很适合闹鬼的房子场景。我喜欢文本转图像的AI的一点是结果可能出乎意料。毫无疑问,我最喜欢的是Midjourney的#3,它甚至没有房子,但传达了一种非常强烈的闹鬼感觉,我非常喜欢。两个AI都生成了精彩的图像。我必须给DALL-E,因为如果你特别寻找一张闹鬼的房子图片,DALL-E的输出更接近你的期望。尽管如此,从艺术的角度来看,我个人非常喜欢Midjourney的成果。「Pixar-style trick-or-treating kids in Halloween costumes」(像皮克斯风格的万圣节服装孩子们一样去“不给糖就捣蛋”)我完全不确定Midjourney试图实现什么。它的孩子看起来介于卡通和真实生活之间。DALL-E的孩子们就像皮克斯动画片中的一样。「Disney-style friendly ghost with scary jack-o'-lantern」我希望它带着一个明显不那么友好、而且希望真的吓人的南瓜灯。通过迪士尼风格,我希望得到一种更现代的动画风格,而不是看起来像是从经典迪士尼艺术家的胶片手绘中提取出来的东西。Midjourney在某种程度上有些偏离了重点,将“圣诞夜惊魂”风格与幽灵图像混淆在一起。此外,幽灵有点吓人,南瓜灯则不够吓人。我毫不犹豫地最喜欢DALL-E的#1。我喜欢友好的幽灵,而南瓜灯具有一定的威胁性,正是我在写这个提示时想要的心境对比。 这里的赢家是DALL-E。两者都绘制了漂亮的卡通图像,但DALL-E理解了意图,并且有一个友好的幽灵和一个吓人的南瓜灯。而Midjourney则完全相反,错过了提示的重点。这可能是我所有提示中最喜欢的。以下是我给AI提供的内容:「Nightmare before Christmas style, Tim Burton style, IT professional in datacenter」(圣诞夜惊魂风格,蒂姆·伯顿风格,数据中心中的IT专业人员)我喜欢这些图像。所有的都喜欢。DALL-E再次使用了实际的参考图像,而Midjourney则受其启发。我的意思是,在DALL-E的图像中,几乎没有疑问的是,杰克·斯凯林顿(Jack Skellington)以某种方式进入了数据中心。Midjourney的图像展示了IT人员,但并没有真正展示出一个数据中心的样子。我绝对最喜欢的图像是DALL-E的#4。是的,它无可否认地是杰克·斯凯林顿,但数据中心的设计非常准确,我非常喜欢。在这一轮中,我必须支持Midjourney,原因与上面Midjourney在“Snoopy风格”回合中获胜的原因相同。DALL-E制作了杰克·斯凯林顿的卡通形象,但由于它如此准确地制作了杰克·斯凯林顿,这四个作品都必须被取消资格,因为没有许可无法使用。这真是个难题。如果计算胜利次数,DALL-E 3在ChatGPT中赢得了7场比赛中的5场,而Midjourney赢得了其中的2场。所以,我想DALL-E是赢家。根据这些测试,我觉得Midjourney提供了很大的价值和一些灵活性,但像大多数艺术家一样,它有自己的思维方式。而在ChatGPT中的DALL-E 3是一个免费的额外奖励,因为我已经购买了ChatGPT Plus。我必须说,DALL-E的结果让我感到惊喜,但它克隆许可权属性的倾向让我有些恐慌。
|