

美军面临着数据问题。如果知己知彼是半场战斗,那么理论上,五角大楼永远不应该输掉这一半。但在实践中,美军的数据问题非常严重,令人困扰,而且考虑到目前加速的步伐,在技术上也令人望而生畏。就在两年前,任何时候大约有十多架北约飞机在阿富汗执行侦察任务。现在,同时有50多架“捕食者”和“死神”无人机在空中飞行,而且它们一直在向地面倾泻大量数据流。
与此同时,更多的无人机正在加入阿富汗和巴基斯坦、非洲之角以及伊拉克和也门等地的战斗。情报、监视和侦察(ISR)传感器正在传统有人驾驶飞机上激增。数据流的速度已经超过了国防部组织和存储它们的能力,并且产生了如此多的噪音,如此多的无法使用的情报,以至于分析人员无法将相关信息从无用的信息中区分出来。所有这一切都发生在一个任何比实时慢一步都可能付出生命代价的环境中。
“我们被传感器淹没了,必须小心,不要被数据淹死,”国防技术问题解决公司MAV6的首席执行官兼董事总经理戴夫·德普图拉(Dave Deptula)说。这并不是德普图拉第一次这么说,也不会是最后一次。在他之前担任情报、监视和侦察部门第一副参谋长期间,德普图拉中将负责规划和实施美国空军的整个ISR战略,并且他亲眼目睹了数据洪水已经漫堤。
“我们被传感器淹没了,必须小心,不要被数据淹死。”“不可避免的真相是,数据速度正在加速,我们目前处理数据的方式已经被这场海啸彻底压垮了,”德普图拉说。“因此,我们将不得不开始探索不同的方法来应对日益增长的超大规模工作负载的挑战。”
仅仅增加军队的机架空间——这一直是迄今为止应对该问题的主要策略——并不能平息这场洪水。国防部不仅需要新的存储方法,还需要全新的作战概念,将新颖的存储架构、各种数字语义,以及——至关重要的——大量人工智能结合起来。
不久的将来,计算机程序将能够同时查看、标记、组织和存储成千上万的视频流,决定哪些传感器数据与当前战斗相关,哪些需要立即关注,哪些需要归档。语言界面将允许分析人员使用类似《星际迷航》的自然语言查询即时搜索他们的数据库。无人机本身也将成为计算机化的情报分析师,实时梳理自己的数据流,只突出最精选的情报。这些技术已经投入使用,这正是技术将如何拯救军队免受其技术困扰。

教会电脑说话
用自然语言与电脑对话的想法在科幻小说中无处不在,随着iPhone 4S及其Siri语音助手软件的出现,现实已经赶上了理想。事实上,如果你看看Siri的起源,这种自然语言界面一直是为了战士而设计的。很快,它将允许情报分析人员自信地与他们的机器——或许更重要的是,与情报界的其他机器——对话,因为他们的电脑能够理解。
“比如说,我是一名在非常明确的战场空间工作的智能分析员,”前海军陆战队情报官员托尼·巴雷特(Tony Barrett)说。“我在海军陆战队,我旁边有一个陆军部队,他们使用完全不同的系统来编目和存储他们的数据。但他们拥有与我的战斗相关的信息,而我拥有与他们的战斗相关的信息。问题来了:我们如何才能让这些数据变得相关,从而让我意识到他们拥有对我很重要的数据?”
巴雷特现在是位于佛罗里达州的软件开发商Modus Operandi的高级业务开发经理,该公司正在帮助国防部有效地处理其数据溢出。但巴雷特和德普图拉一样,知道他问题的答案超出了存储解决方案。Modus Operandi以及类似的公司的正在努力创建自然语言处理和文本分析技术,使机器和人类能够共享通用语言。
如果他们能教会机器像人类一样说话,并反过来理解自然的语言,他们就可以为分布在军队和服务部门和情报界数据库中的信息赋予全新的意义。在这个系统上调用相关数据将像通过Siri调用最近的星巴克一样容易。分析人员只需提出要求。
“该软件会从你的陈述中进行认知飞跃——它会将其翻译出来,弄清楚你的词汇和背后的含义——然后为你返回相关结果,”巴雷特说。“如果你用普通的语言输入搜索——‘告诉我上次报告阿布·巴卡尔的下落’——这个请求的语言、本体和语法都会被翻译并赋予意义。另一端也会发生同样的事情,我们会以一种可用、相关的形式将其返回给用户。”
换句话说,分析人员正在使用他们的电脑进行对话,而不是输入与元数据标签相关的关键词。有了通用的自然语言,数据之间的关联会更加明显,搜索会更快,不同系统和数据库之间的壁垒会消失,整个企业也会变得更有效率。

教会电脑看见
让计算机和人类更好地相互交互,可以增强数据的存储和检索,但这并没有解决关键问题:首先需要分析的原始数据量。这些数据大部分来自无人机或其他飞机的视频,分析人员花费数小时观看录像,对视频数据进行分类,并希望能找到有价值的情报。如果军队想减少浪费的人力,并使情报分析更接近实时,它就必须教会计算机如何“看见”。
说起来容易做起来难。人类瞬间就能完成的事情——看到、识别和评估一个物体——对软件来说却极其困难。人脑可以瞬间将大量的先验知识与一个物体联系起来。而计算机看到的是像素,或者是一系列不同强度的值。尽管物体识别算法正在快速改进,但与人眼相比,计算机视觉仍然非常初级。
但软件开发商Kitware的计算机视觉总监安东尼·胡格斯博士(Dr. Anthony Hoogs)表示,尽管所有这些视频构成了数据问题的主要部分,但从计算机视觉的角度来看,它们也很有帮助。Kitware目前正在领导DARPA的视频图像检索和分析工具(VIRAT)项目的第二阶段,并正在开发可能有助于解决五角大楼数据问题的视频分析工具。
“视频帮助很大,”胡格斯在今年早些时候接受《大众科学》采访时说。“在视频中,我们有一个重要的线索,那就是运动。事实证明,运动相对容易检测,而且你不需要知道物体是什么。如果有什么东西在移动,那个物体所在或曾经所在位置的强度值会发生变化,而这相对容易捕捉。”
胡格斯不能直接谈论VIRAT或DARPA当前在计算机视觉方面的追求,但看看VIRAT项目本身就能指明方向。VIRAT专注于来自“死神”和“捕食者”无人机等UAV的视频片段,其核心在于识别活动的能力,例如人员进出建筑物或车辆从一个地方移动到另一个地方。换句话说,VIRAT旨在快速自动地搜索视频,寻找特定的运动,当它看到这些运动时,它会对其进行标记,从而为分析人员节省无数小时。
当然,计算机视觉能力正在随着视频数据量的增加而加速——“我们看到视觉应用的数量呈指数级增长,”胡格斯告诉我们——机器在解析数字数据方面的能力越强,它们在编目和附加相关性到涌入情报界的级联数字视频方面的效率就越高。很快,无人机将能够识别和跟踪特定的人脸和车辆,当特定目标移动或在人群中被发现时,会提醒分析人员。但所有这些数据仍然需要去某个地方。

即时分析
“视频处理是计算机能力真正发挥作用的一件事,”胡格斯说。“视频(计算机视觉)直到20世纪90年代中期才真正兴起,因为数字视频很少见。拥有数字视频和相对高效地处理它的能力——这得益于更强大的计算机和更大的计算机硬盘。”
但对于“死神”或“捕食者”这类有效载荷能力有限的UAV来说,更强大的计算机和更大的存储架构却是个问题。现在,军队拥有的数字视频比它们能处理的还要多,而且随着传感器的轻便性和鲁棒性越来越强,无人机正以更高的分辨率将更多数据流传输到地面站。数据下行链路在数据采集点和地面最终用户之间造成了瓶颈。
能够携带超级计算机的飞机可以实时处理自己的数据。德普图拉认为,一种解决方案是让95%无用的数据保留在空中,只下传最相关的信息。这意味着要进行即时数据处理。能够携带超级计算机的飞机可以实时处理自己的数据,在处理过程中进行标记、组织和存储。然后,多个分析人员可以同时从地面访问机载数据库,只下载他们需要的预处理数据,而不是等待海量原始数据下传并在地面处理。
这正是德普图拉和MAV6公司旨在为美国空军提供的能力。MAV6公司的“蓝魔”(Blue Devil)飞艇是在一项价值8620万美元的美国空军合同下开发的,作为解决目前困扰阿富汗情报分析人员的数据过载问题的潜在方案。尽管“蓝魔”并非速度型,但它将能够执行长时间的ISR任务(载人或无人),搭载一系列强大的传感器,并能与其他ISR能力(如“死神”无人机)进行互联。
但关键创新在于其机载超级计算机——相当于2000个单核服务器和500太字节的非易失性内存——它将能够一边收集情报一边进行处理和分类。能够进行即时数据处理并只提取和下传最相关的智能信息,将极大地提高有用数据到达地面决策者的速度,并大大减少造成整体数据过载的噪音。

将所有内容联系起来,然后让“人”重新参与进来
显然,超级计算机在飞艇上的模式并不适用于单独的“捕食者”无人机,它没有空间或能力携带自己的车载处理套件。但随着计算机语言和计算机视觉变得越来越强大,存储架构不断缩小,ISR平台不断变化以满足未来需求——而所有这些都已在发生——不难想象在不久的将来,军队将最终重新掌控其数据问题。届时的问题是在机器可靠性和人类决策之间找到正确的平衡,以便武装部队和情报界能够充分发挥两者的作用。
“我总是强调让‘人’参与进来,”Modus Operandi公司的巴雷特说。“总会有需要做出的判断。但如果我看看流行文化,看看人工智能的不断发展——我看到一台电脑赢了《危险边缘》——我开始想到存在着巨大的可能性。”
人工智能是实现ISR未来现实的关键组成部分。未来的无人机将能够收集比以往更多传感器数据,近乎实时地处理这些数据,并确定哪些信息与当前战斗相关,以便立即下传并引起人类注意。其余的数据将被标记上元数据并仔细归档,以便人类分析人员以后可以通过简单的语言查询进行调用。
换句话说,我们将严重依赖机器来完成大量繁重的工作,并做出一些低级别的判断。在生命悬于一线的情况下,这种对技术的依赖可能令人不安,但在数据泛滥的战场上,这几乎是唯一的出路。
“在世界诞生到2003年之间,产生了五艾字节的信息,”德普图拉说。“我们现在每两天就创造五艾字节,而且还在加速。所以这个庞大的数据问题非常严重,如果我们继续像过去那样管理数据,是无法解决的。”
从这个角度来看,技术不仅可以拯救美军免受其技术困扰,而且可能是唯一的希望。