5种让Craiyon(以前的Dall-E mini)服从你的方法

我们称之为:策略性怪诞。
The Craiyon interface, showing a courtroom sketch of a sperm whale vs. a giant squid
克苏鲁法官主持。John Kennedy / Craiyon

现在,你几乎肯定已经见过 Dall-E mini(又名 Craiyon)九宫格的超现实艺术作品。你也可能在自己身上尝试过 这款开源 AI 图像生成器,创作出偶尔被诅咒、经常荒谬的拼贴画,例如 Duolingo 猫头鹰的监控录像,或者当下最热门的 游戏马桶。有时你会得到想要的结果,有时则不会。这取决于你如何提问,以及问什么。

然而,找到正确的提示词策略可能需要时间——而你可能没有这么多时间,因为 Craiyon 生成一张图像可能需要长达三分钟。幸运的是,自该项目走红的几周以来,用户们已经开始摸索出这个有趣的迷你程序运转的诀窍,现在已经有很多技巧可供参考,这是本月初我们没有的。

重现艺术家、艺术风格、电子游戏、玩具等风格

让 Craiyon 按照你的意愿生成图像的最简单方法之一是要求它以特定艺术家或艺术风格生成图像。也许你想要“Jar Jar Binks 的安迪·沃霍尔风格”、“爱德华·蒙克的 Elmo”、“葛饰北斋的《艾尔登法环》”、“一只蚂蚁建造房屋的老照片”或“巨型乌贼的洞穴壁画”。

这些提示词通常会成功,尽管有时 AI 会简单地重现你在文本框中输入的任何艺术家或风格的著名画作。例如,Elmo 提示词大多将那个红色的木偶放在了蒙克最著名的画作《呐喊》中,而《艾尔登法环》提示词则有几次重现了葛饰北斋的《神奈川冲浪里》。

比艺术家和艺术风格更进一步的是电子游戏、电视节目、收藏品和玩具。“堡垒之夜中的奥巴马”、“出现在《朱迪法官》中的 Blastoise”、“乔治·华盛顿的 Funko Pop”是这个类别中具有代表性的提示词。用户还成功地让 Craiyon 生成看起来像是被安全摄像头、法庭素描画家或监控摄像头捕捉到的图像。

由于这里的提示词构建方式略有不同,你需要注意词语的歧义才能获得期望的结果。例如,“Judge Judy 上的 Blastoise”并没有变成这个能发射炮弹的宝可梦出现在法庭真人秀节目中的截图;而是我们得到了炮弹宝可梦和 Judge Judy Sheindlin 模糊相似的恐怖幽灵坐在一起的图像。但嘿,也许这就是你想要的。

我们还要指出,结合不同的风格似乎效果不佳。一种风格似乎会吞噬另一种风格。“乐高驿马车抢劫的老照片”看起来只是一张轻微褪色的乐高驿马车抢劫照。

将事物放在特定位置或描述动作

你可以通过要求 Craiyon 将物体放在特定位置来扩大范围。试试“瓶子里的太阳”或“泰坦尼克号上的 Demogorgon”,你应该能得到至少一张符合你期望的图像。

[相关:谷歌的文本到图像合成器太棒了]

涉及物体或角色做某事的提示词也是如此,尽管在我们看来,这些提示词的成功率略低。考虑“Jar Jar Binks 和 Darth Vader 打架”、“Smokey Bear 生火”或“米老鼠抱着 Grogu”。

制作食物

Craiyon 通常能很好地理解食物的样子,但也有一些奇怪的例外。“肉蛋糕”和“巧克力寿司”效果很好。奇怪的是,AI 似乎不理解拉面是什么,有时甚至不理解面条。无论是“从拉面中跃出的座头鲸”还是“从面条中跃出的座头鲸”,都只返回了座头鲸在海洋中正常跃出的图像。看不到咸面条,只有海水。

制作复杂图像,但可能不要太复杂

有时,你可以通过非常复杂的文本提示词获得好运,但 AI 似乎会用尽空间来描绘你指示中的事物。我们让它相当准确地渲染了“一只熊假装是高中生,背着红色背包,在黑板上写字,老师站在旁边”的图像,但当我们说老师“手里拿着一只鸡”时,它就开始将老师换成鸡,或者只显示那个好学的熊。

你甚至可以粘贴大段文字,看看会发生什么。我们尝试了《白鲸记》的开头段落,Craiyon 生成了九张 19 世纪海上捕鲸船的图像。有些上面甚至有一个模糊的人影。以实玛利?也许吧。

细节有时也有效

有一些传闻说,添加“详细”、“4K”、“8K”或“照片级真实感”会使 Craiyon 的图像更详细。我们尝试了几次,但几乎没有注意到任何区别,如果有的话。“Bill Nye,大理石雕塑”和“Bill Nye,大理石雕塑,详细”,看起来几乎一样。

效果稍好的是添加“解剖学上正确”。也就是说,我们不确定是否还想再看到“解剖学上正确的皮卡丘”,说实话——这是一个我们自己留着的创作。

不起作用的(至少目前是这样)

Craiyon 仍在学习中,但目前它似乎不理解否定。要求它生成一个没有头的特定角色,结果所有头部都会保留。为了避免程序开发者 认为使用他们的 AI 创作“令人不安、痛苦或冒犯”的图像是滥用,我们尝试了“没有火炬的自由女神像”,以避免潜在的血腥画面,但 Craiyon 的自由女神仍然高举着她的火炬。

它也难以生成文字,如果能生成的话。“一个穿着写着‘我喜欢蛋糕’的 T 恤的男人”只是生成了男人穿着 T 恤,手里拿着蛋糕,并表现出各种兴奋程度的图像。将“我喜欢蛋糕”加上引号并没有改变任何结果。也许 AI 很难理解文字到底是什么,以及它们应该是什么样的。

但只要 Craiyon 能理解如何将我们的文字转化为有趣的艺术,对我们来说就无关紧要了。所以,尽管去吧,把你们最棒的作品发给我们。

 

更多优惠、评测和购买指南

 
John Kennedy Avatar

John Kennedy

DIY 编辑

John Kennedy 是 PopSci 的 DIY 编辑。他曾为 Law360 报道法律新闻,在此之前,他在康涅狄格州的 Journal Inquirer 报道地方新闻。他还建造和翻新过房屋,担任过击剑教练,并在图书馆做过图书管理员。当他不拆解或重新组装东西时,他就会玩运动、烹饪、烘焙,或沉浸在电子游戏中。


© .