


使用智能手机进行语音命令并不新鲜,但三星新款数字助理 Bixby 超越了语音识别,集成了深度学习和增强的视觉搜索,使其感觉更像一个真正的生活在您设备中的数字助理。
Bixby 会立刻与苹果的 Siri 和谷歌助手进行比较,但当我们经常将它们视为简单的语音助手时,三星则将 Bixby 描述为拥有自己的基于卡片的视觉界面来传达信息。语音只是其中的一部分。其他方面包括视觉(如使用摄像头扫描二维码、根据封面查找书籍价格或翻译文本)、提醒和推荐。Bixby 是这四项智能功能的统称。
三星负责智能化和物联网的高级总监 Sriram Thodla 在周三的 Galaxy S8 和 S8+ 发布会上向公众介绍了 Bixby。“Bixby 理解上下文,”他说。“它知道你的屏幕上正在发生什么。”
例如,你可以要求它截取你正在进行的操作的屏幕截图,然后将该图像发送给联系人。这种跨越多个应用程序和服务的复杂请求在过去一直让数字助理感到棘手。

三星负责服务战略的副总裁 Mok Oh 在周一举行的新闻发布会上接受采访时表示:“我们说 Bixby 是一个智能用户界面。”
Oh 称赞了 Bixby 的完整性,这意味着如果一个应用程序启用了 Bixby,那么你通过触摸可以做的任何事情都可以通过语音完成。例如,你可以要求 Bixby 将手机的显示语言切换到另一种语言,Bixby 应该会实现。Oh 说,该助手还“认知上宽容”,因此它应该能够处理请求中的模糊性。
Oh 接着重点介绍了该手机的照片应用程序,名为“图库”,以及用户可以在其中执行的数千种不同的任务组合。用户可以以无数种不同的方式命令裁剪或编辑图像,而 Bixby 应该能够处理。
“在很多方面,我们都应用了深度学习技术,”Oh 说,这是 Bixby 的一项能力。其中一个方面是,Bixby 在处理完请求后会给用户一个“赞”或“踩”的选项,让 Bixby 知道它做得如何,并帮助它学习。“实际上,我们在整个技术栈的许多许多不同方面都应用了学习,”他补充道。

卡内基梅隆大学专注于语音的计算机科学研究教授 Alex Rudnicky 表示,这种“赞”或“踩”功能对于 Bixby 等虚拟代理至关重要。“你需要某种形式的强化,基本上允许系统学习——基本上理解用户想要什么与实际发生的情况之间的联系,”他说。“现实地说,代理会犯很多错误。”
亚马逊的 Alexa 应用程序有一个类似的功能,会询问用户是否完成了它想要的操作。
除了倾听能力,Bixby 还能“看到”现实世界。利用 S8 的内置摄像头,Bixby 可以识别场景中的物体,并搜索有关该产品以及相关产品的信息。当然,它还可以让您从三星的合作伙伴那里购买。这是 Siri 目前不提供,但 Google Assistant 提供(尽管效果好坏参半)的功能,但这种增强现实风格的交互是人工智能作为个人助理的逻辑发展。
在视觉搜索方面,三星与亚马逊(用于购物)、Foursquare(用于地点相关功能,Thodla 使用了一个例子,他拍下了纽约标志性的熨斗大厦的照片,获得了关于它的信息以及该地区的美食选择)和 Google 翻译(用于解释不同语言的标志)等各种合作伙伴公司进行了合作。

最后,Oh 说,Bixby 还应该能够掌握情境模式;如果你通常在下班回家的路上打电话,助手可能会注意到这一点,然后建议你这样做。Thodla 在设备发布会上也谈到了这一点,他说 Bixby 可能会在你通常在特定时间乘坐 Uber 时建议你乘坐。
Bixby 有自己的主屏幕,它会根据对典型用法的了解来策划信息。来自各种应用程序的信息显示在卡片上,其中最相关的会被推到最前面。因此,早上它会优先显示天气和电子邮件等内容,而晚上则可能将社交媒体推到最前面。然而,所有这些都是可变的,因为 Bixby 会从用户那里获得反馈。
根据专注于个性化、识别用户生活中的上下文和时刻的人工智能引擎公司 Neura 的首席营销官 Kris Bondi 的说法,总的来说,是模式识别和情境意识(虚拟助理在此期间提出建议)将简单的语音识别和连接技能与人工智能区分开来。