谷歌正在使用人工智能通过艺术帮助人类和计算机进行交流

一个为画不好的人设计的程序
Good Research
谷歌神经网络的绘画方式。谷歌研究部门

本周,谷歌在艺术领域大动作频频。该公司推出了一个平台,帮助那些在艺术方面很糟糕的人进行视觉交流。它还发表了关于教一个同样糟糕的火柴人画家——一个神经网络——学习绘画的研究。

周二,该公司宣布推出AutoDraw,这是一个面向缺乏绘画天赋的用户的网页服务。本质上,该程序允许你用手指(如果你在电脑上,也可以用鼠标)画出苹果和斑马等基本图像。然后,它会分析你糟糕的画作,并提供同一事物的专业绘画版本。然后,你点击你想要的精美画作,它就会用更好的画作替换你的。这就像为绘画提供自动纠正一样。

谷歌创意实验室团队负责人Nooka Jones表示,AutoDraw的目的是帮助人们表达自己。“很多人画得很糟糕,但这不应该限制他们进行视觉交流,”他说。“如果我们能帮助人们通过视觉交流,并利用机器学习的想法,勾勒出他们的想法,或者让他们的想法生动起来,那会怎么样?”

据谷歌创意技术专家Dan Motzenbecker介绍,该系统的底层技术起源于一个令人惊讶的地方。“它是一个最初是为了识别手写体的神经网络,”他说。这些手写体可以是拉丁字母,也可以是汉字或日文字符,如汉字。从那里,“要想到涂鸦,并不是一个大的飞跃。”

当人们画出他们的线条图时,神经网络会尝试弄清楚它是什么。“就像它可以用于字母表中的一个字母,或者一个汉字一样,”Motzenbecker说,“我们可以用它来画一个烤面包机。”

神经网络通过学习数据来变得更好,但当被问及系统如何以及是否从我们的绘画中学习时,Jones说:“理论上是肯定的;我们并不完全披露我们实际上将什么作为输入反馈给算法。”

就像画一个字母有不同的方式一样,画一头大象或一匹马也有多种表现形式。“它看到的越多样的东西,”Motzenbecker说,“它就越能适应看到新的绘画方式。”用户在选择新画作时,也在向AI确认AI的猜测,这可能有助于指导其未来的决策。

“在整个行业中,你看到的一件事,而谷歌比大多数其他科技公司更早认识到了这一点,”位于加州山景城的Shape Security公司首席技术官,也是前谷歌员工的Shuman Ghosemajumder说,“就是利用机器学习来做以前被认为需要直接人工干预的事情。”而机器学习模型需要数据。

“在这种情况下,如果有一个应用程序可能有数百万人使用,能够尝试绘制不同的图形,”他补充道,“即使你的技术现在还不完美,你也正在创建一个惊人的输入数据训练集,可以用来随着时间的推移改进这些模型。”

虽然AutoDraw旨在帮助人们将他们的涂鸦变成更易识别的图像,但这家搜索引擎巨头也对计算机如何绘画感兴趣。周四,谷歌研究部门发表了一篇博文和论文,介绍了他们如何训练一个循环神经网络来绘制猫和猪等物品。

根据谷歌大脑居民David Ha写的一篇博文,研究团队的目标是训练“一个机器,以一种类似于人类的方式来绘制和泛化抽象概念”。据谷歌发言人称,该系统通过接受人类输入(例如,一张猫的图画或单词“猫”)来工作,然后自己进行绘画。

结果既迷人又奇特。在一个例子中,研究人员给系统看了一张三只眼的猫的草图。电脑画出了自己的猫,但这只猫有正确的眼睛数量,“这表明我们的模型已经学会了猫通常只有两只眼睛。”

在另一个例子中,当看到一张牙刷的图片时,谷歌神经网络的猫模型画出了一只毕加索式的猫,但仍然带有牙刷的灵感。

谷歌发言人证实,为AutoDraw和其他研究提供支持的是不同的神经网络,但相似之处很明显:在这两种情况下,系统都利用机器学习来接收输入,然后要么建议专业绘制的图像,要么完全独立地创作新的东西。

 

更多优惠、评测和购买指南

 
Rob Verger Avatar

Rob Verger

技术编辑

罗布·沃格尔是《流行科学》杂志的前技术编辑。他擅长报道航空、交通和军事技术。


© .