这是在丹佛举行的一次科学会议的第四天——二月里忙碌的四天,在一个巨大的迷宫般的大型会议中心里,有长长的走廊和荧光灯,严肃的科学家们在昏暗的礼堂里做着严肃的PowerPoint演示;四天的突破和进展——从纳米技术到生物技术,从人类学到动物学,各种令人眼花缭乱的融合。对于聚集的记者们来说,这四天是要理解所有这些,并迅速撰写报道——而现在有消息传来,这可能是一个轻松的插曲:留意那个带着头颅的家伙。什么?那个机器人人头。
该会议的赞助方,美国科学促进会的新闻人员表示,演示将于明天上午举行。
然而,现在:又一个昏暗的礼堂,又一个演讲,这次是关于受生物启发的智能机器人,即模仿真实生物形态和功能的机器人。美国宇航局喷气推进实验室的约瑟夫·巴尔-科恩,一位圆润、头发灰白的精力充沛之人,对这些可能性进行了旋风式介绍,他表示这些可能性并不遥远——像昆虫一样会行走、飞行、爬行和跳跃的机器人,以及会潜水和游泳的机器人。麻省理工学院媒体实验室的辛西娅·布雷泽尔展示了世界上最可爱的机器人Kismet的视频,它像婴儿一样天真地仰望着一个几乎在对它轻声细语的女人;布雷泽尔谈到了她如何赋予Kismet情感以及原因。最后是德克萨斯大学达拉斯分校互动艺术与工程专业的硕士生大卫·汉森。他有一头浓密的黑发,方下巴,都市时尚艺术范儿的鬓角,他有些笨拙地移动着,显得紧张但又努力保持镇定。原来,他就是那个带着“头”的家伙——但这个头今天停工了,他只是在展示幻灯片:一个微笑的聚氨酯自画像,一个名为Andy-roid的棕褐色机器人,一个戴耳环和眼罩的海盗机器人。如果忽略它们是无身体的头颅这一事实,它们都显得异常栩栩如生。
事实证明,这使得汉森的头部独一无二。过去几年里成为新闻焦点的那些人形机器人——Asimo、Grace、Kismet——都是优秀的机器人,它们多才多艺、聪明友好。Asimo是本田公司塑料外壳的人形机器人,它能双足行走并欢迎参观制造它的工厂的访客。卡内基梅隆大学的Grace,一个六英尺高的金属部件和轮子的组合体,顶部是一个动画电脑显示器脸,它去年曾自行注册参加会议,找到正确的房间并做了演示。几年前媒体的宠儿Kismet,能与人眼神交流,在人们微笑时它也会微笑,并且像婴儿一样通过观察和模仿来学习。谁会不喜欢这三个呢?其他机器人被设计成护士、导师、仆人和伴侣。但尽管它们才华横溢,这些机器人中的每一个看起来……嗯,都像个机器人。它们有时以卡通般的方式吸引人,但它们是金属的、笨拙的、呆板的。
汉森的头颅则不然。因此,第二天上午十点半,记者们——满满一屋子——都等着,电视摄像机也在这里捕捉汉森最新、最先进模型的首次亮相。33岁的汉森走进来,把一个东西放在桌上。那是一个没有后脑勺的头颅,用螺栓固定在一个木制平台上,但它有一张脸,一张真实的脸,有着柔软的肉色聚合物皮肤、雕刻精美的五官、高颧骨和大大的蓝眼睛。汉森把它连接到他的笔记本电脑上,摆弄着电线。他话不多;这本可能是一个尴尬的时刻,但其他人都在忙着观察那个头颅,所以没人注意到。然后汉森敲了几下键盘,它……动了。它左右看。它笑了。它皱眉、嘲笑、焦虑地蹙起眉毛。现在问题开始了,汉森如鱼得水:他说,这个头颅有24个伺服电机,覆盖了人类面部的主要肌肉。它的眼睛里有数码相机,可以观察那些看着它的人,新的软件很快就会让这个头颅模仿观众。它的名字是K-Bot,它是以他的实验室助理克里斯汀·纳尔逊为原型制作的。
K-Bot大受欢迎。在它首次亮相后的几周内,六大洲的报纸和电视上都出现了相关报道。汉森收到了大量的电子邮件和电话:有希望合作的科学家,有生产假肢和外科训练设备的公司,有电影制片人,还有生产性爱娃娃的公司。Androidworld.com,一个提供人形机器人部件、软件和新闻的网站,将汉森的机器人列在其22个头部项目的榜首,热情地赞叹道:“哇——这个人显然是世界上顶级的头部制造商之一。”
对于一个33岁的UTD研究生来说,这是一个非凡的关注爆发。但至少在短期内,整件事正如人们所宣传的那样:汉森的K-Bot暂时充当了一个轻松的插曲。没有人问为什么在世界上所有的机器人学家中,似乎只有汉森试图建造一个在形态和功能上与人类无法区分的机器人头部。没有人指出他正在违反机器人设计师之间长达数十年的禁忌。也没有人问他将如何做到这一点——他计划如何穿越恐怖谷到达另一边。
大卫·汉森拥有那种复杂的背景,这可能正是他敢于挑战机器人领域既定观念的先决条件。在他的网页上,他自称是雕塑家兼机器人学家。
在80年代后期,他在丹顿的北德克萨斯大学作为一名漫无目的的物理专业学生度过了两年,在那里他追求着,用他自己的话说,“狂野的想象力驰骋”——例如,他把自己的公寓变成一个“热带天堂”(植物、鹦鹉、树蛙、一条小溪),用于他和朋友们称之为“扰乱马拉松”的四天派对。“那些恶作剧,”他说,“都是一流的。”这些项目助长了他旷课的习惯;汉森的成绩下降,这使他失去了助学金,并被迫离校。然后,在1992年,他被罗德岛设计学院录取,那是美国顶尖的艺术学校之一。
在RISD,汉森通过建造“原始泥浆浴”疏远了教授们,那是一个巨大的装置艺术,艺术爱好者们在其中爬行、滑动和游泳,浸泡在凝胶状海藻提取物中。在他孤独古怪的青少年时期,汉森沉迷于绘画和
科幻小说——菲利普·K·迪克和艾萨克·阿西莫夫是他的最爱——而在RISD,他以一种方式成功地融合了他的两个爱好。他在附近的布朗大学上了一门人工智能课,并在1995年将一个独立研究项目聚焦于“出体体验”,建造了一个可伸缩的五英尺杆上的遥控人形头部。这个头部,他将其塑造成自己的自画像,可以在房间之间移动,并与人聊天(通过远程操作员)。“将雕塑变成一个有智能、有感知力的存在,这个想法一直萦绕在我脑海中,”他说。
毕业后,汉森做了六年艺术家,最终在洛杉矶的迪士尼工作,在那里他雕刻主题公园角色,研究新材料,并与动画电子专家交往。2000年,他看到巴尔-科恩在一个高科技材料会议上发表演讲;在喷气推进实验室,巴尔-科恩正在开发电活性聚合物,用作NASA机器人的人造肌肉。受到启发,汉森向巴尔-科恩展示了他的作品集,巴尔-科恩决定给这位才华横溢、积极进取的华特迪士尼艺术家一个机会;他让汉森写一章书,描述人造肌肉网络如何驱动机器人。2002年初,巴尔-科恩再次发掘了他年轻门徒(现为UTD研究生)的才能;巴尔-科恩当时正在为NASA高层准备一份关于该机构新兴机器人技术的演示文稿,他意识到他需要一些视觉冲击力——于是他寄给汉森一个人类头骨的塑料模型,并给了他一周时间来建造一个头部。
2002年4月,汉森拿到头骨的那个晚上,他抓起一把卡尺,前往达拉斯一个名为“博览公园”的艺术区仓库里的一个热门酒吧。在那里,他迅速扫视了房间,发现克里斯汀·纳尔逊——一个他认识的,身材修长、蓝眼睛的黑发女子——正在酒吧里和一个男人聊天。汉森走过一两次,他们互相笑了笑。最后他走上前打招呼。“我能测量一下你的头骨吗?”他问道。
或许那并不是汉森确切地,或完全地,问的问题。等到二月的AAAS会议和K-Bot揭幕时,汉森的机器人建模直觉已经结出了超乎他最狂野期望的硕果:他和纳尔逊订婚了。毫不意外地,他们的“浪漫邂逅”故事被反复讲述;当两人回忆那个晚上时,他们会互相补充对方的话,并扩展对方的细节。汉森说他问纳尔逊是否可以测量她的头骨。她记得略有不同
“他问,‘我能把你变成一个机器人吗?’”
他能把她变成一个机器人吗?他能把一个机器人变成她吗?他甚至应该尝试吗?在汉森和纳尔逊开始酒吧里的玩笑互动前一个月,汉森就已经发现,机器人学家对最后一个问题的几乎普遍回答将是响亮的“不”:大卫·汉森不应该试图让他的机器人看起来太像克里斯汀·纳尔逊,因为这样做将意味着冒着跌入恐怖谷深渊的风险。
在70年代后期,一位名叫森政弘的日本机器人学家发表了一篇后来影响深远的见解,阐述了机器人设计与人类心理之间的相互作用。森政弘的核心概念认为,如果你以与人类的相似度为X轴,以情感反应为Y轴作图,你会发现在通往完美逼真仿生机器人的过程中会发生一件有趣的事情。不出所料,曲线稳步上升,随着机器人变得更像人类,情感接受度也随之增长。但到某个点,在真正逼真之前,曲线会急剧下降,穿过中立的底线,进入真实的厌恶,然后再次上升到第二个接受高峰,对应100%像人类。这个鸿沟——森政弘的恐怖谷——代表了一种观念,即某些像人类但又有点不对劲的东西会让人产生排斥。在这里,潜伏着怪物。
Kismet的创造者布雷泽尔,像她的许多同事一样,从恐怖谷理论中汲取了灵感和警示。Kismet温和的表情和巨大的婴儿蓝眼睛,旨在让机器人在接受曲线上尽可能地接近森政弘的第一个高峰,但它无可争议地仍然是一个机器人,因此没有跌落悬崖的可能。布雷泽尔说,要与机器进行社交互动,人们必须接受它。一张看起来不太对劲的机械人脸是“令人不安的”,她说。一张动作不自然的逼真面孔会“加倍令人毛骨悚然”。
布雷泽尔是第一个让汉森知道他正在进入这片未知领域的人。2002年初,汉森在一个会议上遇到了她,并就机器人头部展开了对话。“她似乎完全拒绝了复制人脸的理念,”他说。“我感到有点悲伤,因为我心中的这位英雄会持有与我截然相反的观点。但我同时也感到了一种挑战。我感觉到一种乐趣,好像我发现了什么。”
汉森为巴尔-科恩建造的第一个头部——Andy-roid——坦率地说,只是一个粗糙的原型。区区四个伺服电机只允许它做出少数几个相当不自然的表情。然而,一旦完成那个模型,汉森便不顾一切地投入到追求机器人逼真度的研究中,这远远超出了以往任何尝试。他仔细研读了《格雷解剖学》,并痴迷地浏览医疗网站,记录下人类主要的表情肌,从提升眉毛、皱起额头的额枕肌,到拉下嘴角形成皱眉的口角下降肌。他吸收了心理学家保罗·埃克曼的开创性工作,埃克曼分类了数千种面部表情,详细说明了哪些面部肌肉以何种方式组合运动来创造每一种表情;他思考了特定肌肉、肌腱和韧带如何协同工作以移动面部各个部分的力学原理。他研究了他认识的每个人的面部形态、构成、比例和轮廓;他花了数小时对着镜子做鬼脸。
然后他用塑料模具和材料进行实验,从内部为头部安装了24个伺服电机、两个微处理器、固定装置和尼龙鱼线来牵拉皮肤。接着,他给头部接线并编写了软件来控制它。
进展很艰难。为了获得准确、可信的表情,汉森没完没了地调整伺服电机的位置和牵拉皮肤的线条。他早期原型头颅的聚氨酯皮肤太僵硬太重,伺服电机无法带动,于是他发明了一种新的聚合物,他称之为F’rubber(泡沫+橡胶x弗雷德·麦克默里)。现在,他和纳尔逊致力于完善F’rubber配方,他们在搬到好莱坞的公寓浴室里混合了970种成分组合,直到找到了一种既有弹性又柔韧,且极其稳定的聚合物。在K-Bot于二月首次亮相前一个月,汉森连续一周每天花三到四个小时在当地一家五金店里,拼凑黄铜水管零件,为机器人制作一个可移动的颈部。店员反复问他是否还好。最终,汉森用来自爱好、工艺品和五金店的400美元零件建造了K-Bot,费用由他的学生贷款支付。
随着汉森工作的进展,他越来越清楚地认识到,制造栩栩如生的机器人头部不仅仅意味着建造一个令人信服的表面和创造逼真的面部表情。因此去年底,他开始考虑K-Bot的大脑。互联网将他引向洛杉矶的一家公司Eyematic,该公司生产最先进的计算机视觉软件,能够识别人脸和表情。汉森找到了联合创始人兼首席技术官哈特穆特·内文,后者给了他一份该软件的测试版。接着,通过一个汉森在科学会议上认识的共同熟人,他接触了圣地亚哥加利福尼亚大学的认知科学家约亨·特里施,特里施正在使用机器人头部测试关于视觉和基本社交技能背后心理过程的理论。在UCSD还有哈维尔·莫维兰,他正在研究能让社交机器人辅导学童的技术。汉森开始定期从好莱坞通勤到UCSD,单程火车需要三小时。
今年春天的一天,汉森和我参观了莫维兰在UCSD的实验室,那是一个阳光明媚的房间,里面堆满了书本、艺术品、人以及电脑。莫维兰请汉森为他建造一个头部,并希望赋予它社交技能。他和玛丽安·巴特利特(加州大学圣地亚哥分校机器感知实验室的认知科学家,共同负责人)合作开发了一款软件,其中有一个动画教师,帮助孩子们学习阅读。孩子在屏幕上阅读文本。这位教师能够识别孩子是否看起来沮丧,并且很快就能进行口头回应。这个角色还会做出与孩子正在阅读的故事相符的表情。莫维兰计划对汉森的一个头部进行编程,让它执行教师角色的功能,然后与孩子们进行测试。汉森说,科学问题是“人们对三维实体面孔的反应是否比对电脑生成面孔的反应更强烈。”
受到这种将他的人形机器人头部应用于实际的启发,汉森开始称K-Bot为“社交机器人的面孔”,并表示他正在向机器人工程师“发出挑战”。这就是他对恐怖谷缺乏耐心的原因:这是一个基于恐惧而非可能性的概念,它主张我们应该避开让机器人看起来过于像人类,而不是去探究真正栩栩如生的机器人可能带来哪些积极益处。“实现人类外观的精妙之处是一个真正应该承担的挑战,”他说。汉森表示,只有逼真的头部才能挑战人工智能研究人员,让他们整合各种机器人能力——自适应视觉、自然语言处理等——以创造“集成化人形机器人”。
像K-Bot这样的面部机器人还可以帮助心理学家准确地弄清楚,哪些面部动作能将一个人的恐惧、悲伤、愤怒或喜悦传达给另一个人的思想。范德堡大学心理学家克雷格·史密斯说,如今,心理学家通过观察人们如何解读视频剪辑或动画角色中演员的挑眉、蹙眉及其他表情来尝试做到这一点。但即使是演员也很难精确地操控他们的表情,因此实验并非总能完全受控,而且动画角色可能过于不真实。史密斯说,一个能做出准确面部表情,并且每个面部动作都能精确控制的人形头部,将使研究人员能够以三维和实时的方式,探明特定面部肌肉在传达情感方面的作用。他说,这将解决一个“自达尔文时代以来一直是个谜”的问题。
在我们参观莫维兰实验室的那个下午晚些时候,汉森和特里施坐在校园咖啡馆的庭院里,凉爽的微风吹拂着桉树。他们原本计划写一篇关于汉森面部机器人的科学论文,但尚未决定焦点。汉森建议道:“如果我们写一篇关于如何穿越恐怖谷的论文呢?”特里施伸长双腿,看着汉森,点了点头:“我觉得那会很棒。”
很快,两人来到特里施的会议室,在一块白板上描绘着恐怖谷。汉森指着山谷的边缘说:“森政弘说,‘停在这里。不要再往前。无论如何,都不要再往前!’”特里施皱起了眉头。汉森继续说,现实主义不能只用一个轴线来描绘;它取决于形状、时机、运动和行为。他说,这个想法“其实是伪科学的,但人们却把它当作科学对待。”
事实上,尽管恐怖谷理论被奉为圭臬,它也仅仅是一个理论。“我们有证据表明它是真的,也有证据表明它不是,”卡内基梅隆大学研究人机交互的心理学家莎拉·基斯勒说。她称这场辩论为“神学式的”,双方都带着坚定的信念争论,却鲜有科学证据,并表示这种来回的争论在涉及面孔时最为激烈。“我想用会说话的头颅来测试它,”她说。
在2001年《科学》杂志上发表的一篇关键论文中,奥拉夫·斯波恩斯来自
布卢明顿印第安纳大学的奥拉夫·斯波恩斯以及其他六位领先的机器人学家描述了一种新型机器人,它们能自主探索世界并学习。这些新型机器人,包括斯波恩斯的达尔文五号,拥有可移动的身体和传感器,能像我们一样感知环境。它们被赋予了一个从出生就开始学习的发展程序。它们需要人类看护者来教导它们关于世界所需的一切。特里施,以类似原理编程他的机器人,他说:“我们越来越倾向于像养育孩子一样培养机器人。”
至少需要几十年的时间才能培养出像我们一样聪明和独立的机器人,但这项工作已经开始。能自主学习的机器人、能行走的机器人、能与人社交的机器人,目前都处于不同的发展阶段。“一个逼真的自主人形机器人是圣杯,”斯波恩斯说。而且,在恐怖谷的另一边,机器人将拥有一张逼真、富有情感表现力的面孔——一张挑战机器人大脑建造者去制造更智能机器人的面孔,一张欺骗我们把机器当作人类来对待的面孔。一张人们可以产生依恋的面孔。
在2002年出版的著作《肉体与机器》中,麻省理工学院著名机器人学家罗德尼·布鲁克斯(他曾监督Kismet的开发)写道,“人类长达数世纪建造人造生物的探索正在结出硕果。”他认为,我们将与这些机器建立不同于以往所有机器的关系。“即将到来的机器人革命,”布鲁克斯写道,“将改变我们社会的基本性质。”
今年春天一个凉爽晴朗的日子,汉森、纳尔逊和我一起在格里菲斯公园陡峭的山坡和峡谷间攀爬。标志性的好莱坞字样矗立在附近的山坡上,洛杉矶雾霾之上的天空一片湛蓝。我们在一个山顶上休息,可以眺望数英里。汉森说,人类正面临一场身份危机,只有少数人了解,但许多人有所察觉。“如果我们能将使我们成为人类的特质机械化,那将使我们感觉自己像一个机器,”他说。或许这正是抵制逼真人形机器人、不愿冒险进入恐怖谷背后的真正原因。而当我们真正跨越过去之后呢?在二月的AAAS会议上,有人问汉森他的最终目标。他说,是一个富有同情心的机器人:一个同伴,一个朋友。他说,目标是“让它自由发展”。
丹·费伯是一名居住在伊利诺伊州厄巴纳的自由撰稿人。他是《科学》杂志的特约通讯员。