独家揭秘超秘密人工智能初创公司 Viv

ISS Assembly Mission 1 A/R in orbit
国际空间站的第一块模块于1998年11月20日发射升空。这块被称为“曙光号”控制舱的模块,提供了电池供电、燃料储存和对接空间。基本上,“曙光号”模块包含了维持空间站运行所需的许多必需品,并作为其核心。NASA

在3月下旬举行的微软Build开发者大会上,首席执行官萨提亚·纳德拉站在台上宣称:“聊天机器人就是新的应用程序。”他当时正在介绍该公司新的聊天机器人开发平台,并承诺该平台将“为我们的电脑注入关于我们自身和上下文的智能。”无论是有意还是无意,纳德拉也在为硅谷数十年来最激烈的竞争之一铺平道路。

在两个月内,Facebook和Google就宣布了智能助手,与苹果的Siri、亚马逊的Alexa和微软的Cortana(纳德拉在Build大会上承诺对其进行升级)齐名。就在上周,苹果宣布计划将Siri的SDK开放给第三方开发者,而大多数人预计,在苹果本月晚些时候举行的全球开发者大会上,将会有重大的Siri发布——甚至可能是亚马逊Echo的竞争对手。

在这次混战中推出的还有Viv,这是硅谷一家最神秘的初创公司(也名为Viv)备受期待的AI助手。在5月初的Tech Crunch Disrupt大会上,联合创始人兼首席执行官Dag Kittlaus首次亮相该应用程序,利用Viv的自然语言能力完成了一些巧妙的事情,比如查询天气和发送Venmo付款。上周在欧洲举行的Pioneers Festival大会上,Viv联合创始人Adam Cheyer——他与Kittlaus一起开发了Siri,然后将其出售给了苹果——对Viv进行了更大力度的推广。Cheyer提出了一个复杂的请求:“给我订一张三天后下周五从JFK到SFO的单程直飞航班的靠窗座位。”Viv在不到一秒钟的时间内就给出了选项。

听众们对此印象深刻。即便如此,也很难不将Viv视为科技巨头中的一家初创公司。那就错了。

在硅谷,自然语言识别被视为用户界面的下一个前沿。正如25年前浏览器的兴起和搜索重塑了Web上信息和金钱的流动一样,人工智能和自然语言识别也将如此。这种想法认为,如果我们能像对待朋友一样与机器交谈,我们就会用它们做更多的事情,而不仅仅是交换信息:我们会把它们当作代理来处理信息。

在科技界,有些人已经将这种模式称为“服务型对话”。虽然这是科技术语的泛滥,但不可否认的是,谁控制了对话,谁就将控制未来的Web,或者至少是其中的一大部分。那么,会是谁呢?

这还有待观察。让大多数初创公司创始人沮丧的是,在消费技术领域,真正的范式转变是罕见的。它们发生在一家公司构建了一个用户友好、足够灵活的系统或产品,能够满足广泛的需求,并提供多样化的产品和服务。例如亚马逊以及苹果的iPhone和App Store就是证明。

在数字助手的领域,这种范式转变似乎还有一段距离。技术已经达到了实用阶段(今天天气怎么样?),以及新奇阶段(你能为我打拍子吗?)。但用户发现自己更多的是被AI助手的局限所困扰,而不是发现其潜力。例如,Siri可以帮助你预订晚餐。这很好,但试试让她将预订时间从晚上7:45推迟30分钟到8:15,或者将就餐人数从四人改为六人。这不可能。

要理解为什么会这样,可以将大多数助手视为高度复杂的电话菜单。产品团队的某个人会识别出助手的潜在用例,然后交给一小批程序员以最好的方式满足该用例。重复数万次。这不算是个糟糕的系统,但也不是一个特别可扩展的系统。人们会以各种疯狂的方式提出各种疯狂的要求。任何一个团队能构建出多大的任务和命令百科全书呢?

这就引出了Viv。该公司对其技术和测试合作伙伴守口如瓶,但它显然与竞争对手不同。首先,它不使用电话菜单的方法。Viv动态生成代码。它使用自然语言识别来理解用户的意图,然后编写相应的可执行命令,并将其与不同的集成服务连接起来。此外,它会记住这些交流。还记得那个晚餐预订吗?Viv会记住——如果你愿意,它还会回去更改。

其次,Viv将是一个开放的系统。理论上,它将是唯一一个可以在不同平台、设备和电信服务之间工作的助手。这与Siri、Cortana、Alexa和Facebook M形成对比,它们在很大程度上仅限于自己的“围墙花园”。Google提出的助手听起来与Viv有点相似,因为它可能跨越平台和设备,但我们得等到今年晚些时候才能知道。

第三,Kittlaus表示,Viv将向第三方开发者敞开大门。正如App Store促进了iPhone应用程序开发一样,Kittlaus表示,开放的SDK也能为Viv做同样的事情。诚然,亚马逊在这方面已经做得很好,而Facebook、苹果和Google也表示他们计划这样做。尽管如此,Kittlaus说,Viv将为开发者提供更多的自由。软件或硬件开发者将能够将他们的服务集成到Viv中。但他们也将能够将Viv集成到自己的产品或服务中。你不太可能很快就会在路灯里和Siri对话(你是否愿意是另一回事)。

目前,该公司在选择测试合作伙伴方面仍然非常挑剔。他们目前大约有50个合作伙伴——想想支付、食品和鲜花配送服务、票务代理、音乐服务、汽车制造商等等。但Kittlaus坚称,在发布时(可能在今年年底或明年年初),Viv将向大众开放。

将这些属性加在一起,Viv相对于其他助手具有一些明显的优势。Kittlaus对我说:“我们花了三年半的时间来解决其他公司甚至不知道自己存在的问题。”然而,没有人,包括Kittlaus,对前进道路上的重大障碍视而不见。

Viv的竞争对手是世界上最大的科技公司(以及像Hound这样的其他强大的初创公司)。这足以让任何一个最坚定的硅谷人士感到震惊。此外,那些大公司已经拥有了Viv急需的东西:用户。没有用户,开发者就不会为Viv开发新颖的东西。但没有新颖的东西,就没有人会使用Viv。打破这个两难困境的唯一方法是制造一个比竞争对手好几个数量级的产品。这非常非常困难。不过,如今也没有多少Lycos或Alta Vista的粉丝了,所以希望永存。

或许正是出于这些原因,Viv一直对媒体保持极度谨慎。Kittlaus自创立Viv以来只接受过几次采访,在Pioneers Festival大会上,他拒绝了我们之外的所有采访请求。

谈话一开始很谨慎,但随着时间的推移,Kittlaus无法抑制他对这款产品充满热情的表达,他认为这款产品在竞争中遥遥领先。很快,他掏出了手机——“我真的不应该这么做,但是……”——并当场给我演示。

在维也纳一个嘈杂拥挤的房间里(信号为3G,而非LTE),Kittlaus对Viv进行了测试。他保持了基本的演示:我出生那天天气怎么样?(正如我母亲所说,非常炎热,有几场雷暴。)它能否预订第二天从维也纳到SFO的单程航班(是的,单程447美元,“需要我为您购买吗?”)?它只失败了一次:它无法检索另一个人的生日天气,可能是因为记录尚未存档。

演示很精彩——如果我们购买了机票后又立即更改,演示效果会更好。但也许更重要的是,Kittlaus敞开了心扉,分享了他对Viv的宏大愿景。Kittlaus说,他的目标不仅仅是推出另一个智能助手。他希望Viv成为一种新的标准,就像WiFi或USB一样。它可以成为与任何事物进行智能对话的象征,并且,如果时机成熟,它有可能重新定义我们与机器的关系,达到如今难以想象的程度。

附言:您能向我介绍一下指导Viv的核心原则,以及在您看来,它与其他助手有什么不同之处吗? DK:我们有四项指导原则:一个助手、个性化、任何设备和所有服务。将它们视为一组规则,我们相信,总的来说,它们将把当今有趣、半有用、略带噱头的助手提升到一个更高的水平。一个助手意味着你想要一个了解你的单一实体。这就引出了个性化。任何设备意味着你不必每次与新事物交谈时都重新开始,这很好。所有服务意味着向Viv开放,允许第三方开发者创建或教授Viv东西。最后一个是我们为使助手与浏览器和本地应用程序相媲美所做的最重要的事情。

您曾帮助创办Siri,并且对大多数助手的工作原理有深入的了解。Viv是如何在他人停止的地方继续前进的? 像Viv这样的每个平台,基本上都有一个产品经理来确定新功能应该是什么。然后,开发人员会在大多数情况下硬编码一个命令,“如果有人问起这个,就做那个”。问题在于,这种方法无法扩展到全球。

Viv允许第三方开发者进入——几乎就像一个AI维基百科——并使用一套相当简单的工具来构建他们想要的任何东西。这使得Viv的能力可以从其他助手今天能做的几十件事扩展到成千上万、数万甚至数不清的能力。

所以,这是巨大的飞跃。Viv允许来自世界各地的数千人同时教它新东西。

您提到过您的秘诀是Viv能够编写自己的命令。实际上,它是一个自我编程的程序。这如何能带来更好的体验? 简单来说,在所有其他情况下,对于任何类似的系统,个人开发者都需要一步一步地告诉机器该做什么。标准是教AI某些东西,然后不断地训练和训练,使其越来越好。当有成千上万的服务时,你无法做到这一点,特别是当许多服务以你从未预料到的方式协同工作时。通过自然语言识别用户的意图,并动态地编写命令来响应,这是我们的一大飞跃。这项能力与大量服务相结合,可以改变你使用助手的方式以及你依赖它的频率。这是最重要的事情。

*如果这是您的主要优势,那么主要劣势是什么?您认为自己如何克服它?* 我们有一个双边市场模型,这是一个先有鸡还是先有蛋的问题。我们需要用户群,也需要开发者来创建一些服务。此外,我们正在与已经拥有数十亿用户的公司竞争。

在我们开发出庞大的用户群之前,已经有很多人参与进来了。现在,我们需要推广并为开发者创造额外的吸引力。他们中有许多人有很多想法,并看到了潜在的商业模式。我们完全被感兴趣的各方淹没了。

您说您正在开发消费者版本。为什么? 是的,我们正在开发。虽然Viv有望出现在很多地方,但我们也正在开发一款比大多数其他系统都要先进得多的消费者应用程序。目标是从第一天起就为消费者带来好处。然后,我们需要在拥有1亿用户之前,持续激励开发者参与进来。

我们何时可以下载消费者版本? 准备就绪之时……

您曾说过希望Viv成为一个新的标准。您是什么意思? 是的,我希望Viv成为一种新的实用工具,就像WiFi和蓝牙一样。它应该是你与世界交流的方式。

以Viv为中心的世界是什么样的? 与一切的交互大大简化。上周我和一位六十多岁的人交谈。他问我在做什么。我解释了,他打断了我。他说:“哦,所有这些技术的东西——我就是不懂。”我说:“这个想法的全部就是要你不再需要懂它。你所要做的就是和它说话。”

语言是我们所有人与生俱来的、自然的交互模式。你交谈的事物越多——在有意义的情况下——操作或交互就越简单。我们所谈论的是一个你希望能够与一切交谈,并让你的助手为你做所有事情的世界。

在这个完美的世界里,我能和什么交谈? 嗯,任何有意义的事物。任何今天需要复杂交互的事物。你将能够与你的汽车交谈;人们已经开始这么做了。在美国,我们每年浪费10亿小时的通勤时间。想象一下坐在车里,你正在进行圣诞购物,与你的助手谈论不同的礼物。想象一下在你回家后不久就能送达的食物订单。当你早上准备上班时,你还会和你的镜子交谈。它们有显示屏,应该很快就会上市。有了Viv在你的镜子里,你可以查看你感兴趣的话题的头条新闻。你可以看图片。你知道的,“把那个放大一点。就在那里放大。”我的意思是,谁知道呢?还有医疗应用。一切都开放着。

有人向你提出过的最疯狂的应用是什么? 今天有人告诉我,他想做的第一件事就是创建一个允许任何人用自然语言编写程序的应用程序,而无需实际编码。这有点超乎想象。

Viv会成为一个真正的伴侣吗? 毫无疑问。我认为智能助手——而且希望Viv能赢得这场游戏——将变得如此普遍,以至于我们的孩子会问我们,他们怎么可能没有它们长大。我的孩子们问我,他们怎么可能没有笔记本电脑就去上大学。你将拥有你所谓的“数字右手”,它将是你委托生活中琐碎任务的普遍方式,以至于你无法想象没有它的生活。这就是长期目标。有了Viv,我们将完成我们开始的事业。

 

更多优惠、评测和购买指南

 
© .