

谁需要看你孩子玩iPad整整两分钟呢?计算机科学博士生赵斌(Bin Zhao)表示,他甚至从不看自己录制的视频。“我的手机里有很多视频,但实际上我几乎从不回顾那些视频,”他告诉《Popular Science》。“主要原因是视频本身可能长达五到十分钟。”
赵斌和他的导师、卡内基梅隆大学的Eric P. Xing提出了一个有趣的解决方案。他们开发了一种算法,可以识别视频中无聊的部分并将其剪辑掉。最终产品就像一个精彩集锦。用户甚至可以指定想要的集锦长度——比如30秒。这样就更容易消化了。“我们的动机是人们不想看原始视频,”赵斌说。
赵斌和Xing并不是第一批尝试自动识别视频中有趣或重要部分的计算机科学家。许多研究人员和公司正在努力开发软件,以便在监控视频中实时发现异常活动。至少有一家公司表示他们销售的系统可以做到这一点,但研究仍在进行中。一个能够识别重要场景的程序也可能对社交媒体公司大有裨益:想象一下能够制作精炼、有趣的视频与你的网友分享。
“我们的动机是人们不想看原始视频。”
这种新算法通过创建一个“词汇表”来解释它在处理视频时看到的内容。然后,它会随时问自己,“我能用我的词汇表解释现在正在发生的事情吗?”如果答案是否定的,那就表明视频中出现了新的、令人兴奋的内容,因此算法会将其记录下来。算法在开始制作精彩集锦之前,不需要观看整个视频。这一点,再加上赵斌和Xing使用的编码技术,有助于算法更快地工作。
赵斌说,他的新算法非常快速,而且在选择要提取的场景方面非常像人类。它处理一个小时的视频需要一到两个小时,而科学文献中发表的类似算法则需要10到20个小时。为了测试算法是否能像人类一样选择“有趣”的场景,赵斌和Xing让三个人观看了视频并从中选择了要突出显示的片段。然后,计算机科学家们检查了人类选择和算法选择的匹配程度。对于20个个人视频中的18个,赵斌和Xing的算法比他们测试过的其他三个竞争算法做出了更像人类的选择。两人还检查了五个安全类型的视频,展示了人们进入地铁站等场景。他们发现,他们的算法和其他一个算法的表现优于其他算法。赵斌将于本周在电气电子工程师协会(IEEE)主办的会议上展示他们的成果。
赵斌现在计划创办一家名为PanOptus的初创公司,以商业化他的软件。PanOptus的iPhone应用程序和API正在开发中。
看看Xing的儿子视频中的算法效果