

在激烈的战斗或积极的枪击事件中, untrained observers 很难正确识别试图杀死他们的武器。记者(包括在下)在首次描述袭击中使用的武器时,通常会含糊其辞,用包罗万象的“轻武器”,或仍然很宽泛的“步枪”、“手枪”和“自动武器”来承担大部分工作。但是,如果一个计算机算法可以查看一个人持有武器的公开图像(例如来自社交媒体),并自动检测出该武器是什么呢? Justin Seitz 的一项新项目 自动开源情报项目 旨在做到这一点。
首先,问题的规模。存在的枪支数量惊人。不仅仅是枪支,据轻武器调查估计,2007 年至少有 8.75 亿支,而且枪支的种类也非常多。而且不仅仅是最近的枪支;北约部队在阿富汗发现了可以追溯到第一次世界大战的 多件武器,甚至还有一把 来自 1870 年代 的。 《简氏枪械识别指南》是一本面向执法部门和其他法律当局的枪械识别参考手册,其中包含近 400 种枪械的详细信息,并列出了超过 1100 个其他枪械品牌名称。即使是如此深入的知识,也以“本书的内容不可能是百科全书式的”的免责声明为开篇。
幸运的是,对于 Seitz 的项目而言,计算机程序应该能够做得比参考手册更好。首先,为了教会程序准确识别武器,Seitz 向 Imagga 标记工具 输入了只有枪支本身的图像,不包含人。然后他尝试了包含人持枪的图像。该工具试图标记其他事物,例如“时尚”,但在进行一些手动裁剪后,它再次识别出了武器。手动裁剪图像违背了自动武器识别的初衷,因此他编写了一个 Python 函数,本质上是逐块查看图像,对其进行标记,然后只保留带有所需关键字(“枪”、“武器”、“格洛克”等)的已标记部分。
Seitz 在 博文 中详细介绍了整个过程,并附有关于特定代码行作用以及为什么人们希望它们这样做的注释。他在这篇文章的第一部分(还有另一篇续篇)中总结道,该模块能够正确标记以前棘手的图像,将其标记为“武器”。
这是该项目的绝佳开端,很容易看出它如何可以扩展,不仅可以识别照片中是否存在武器,还可以标记武器的种类。不过,这仍然需要一段时间,所以暂时不要丢弃参考手册。