你是否曾有过动物甚至植物闯入你公开分享到社交媒体的照片?即使你并非有意,你也可能正在帮助保育科学家了解更多关于野生动物的去向。随着生态系统迅速变化,科学家们正争分夺秒地了解不同动植物的反应,以及它们是原地不动,还是出现在了别处。
威尔士卡迪夫大学的一组研究人员着手研究是否可以使用Flickr这样的在线社区摄影中心来追踪英国境内入侵物种和本土物种的分布。他们的案例研究于上周发表在《PLOS ONE》杂志上。
卡迪夫大学计算机科学研究员、该论文的作者之一Thomas Edwards表示,他和他的同事们在得知许多保育组织难以获得足够的资金来聘请专家进行广泛的实地考察后,对利用社交媒体进行“被动公民科学”产生了兴趣。
[相关:这些自由漂浮的机器人可以监测海洋健康状况]
这个项目有着非同寻常的起源:当时卡迪夫的一些团队正在利用社交媒体探测人群中的骚乱。“我们当时在讨论是否可以借鉴类似的方法,因为有更多的人在拍摄房屋、猫或常春藤的照片。很多人都会去自然徒步,”Edwards说。“这些都是非常有用的信息,通过社交媒体,这些信息都被地理标记了。你可以比[通过]传统研究更精确地定位它们。”而且,即使一张照片主要聚焦于某种特定的动物,比如鸽子,背景中也可能潜伏着其他无人注意到并标记的物种。
主动公民科学已经发展成为一个收集生态信息的不可思议的资源。“它的缺点是它依赖于这些活动,并且需要有人在那里设立一个活动项目来执行,”Edwards解释道。“你会得到一些零散的群体,他们会提供非常有价值的数据,但你却得不到住在街对面的多丽丝阿姨,她拍下了自家后院一只鸟的照片。”
另一方面,通过被动公民科学,研究人员可以梳理Flickr等公共平台,收集尽可能多的野生动物出现信息(包括有意和无意的)。“你确实会从中得到很多无效信息,但也会获得更多的数据。这就是像这样的方法和分类步骤发挥作用的地方,因为然后你就可以从中筛选,”Edwards补充道。“这可能不像一个经过精心策划、 vetting 所有参与者的活动那样理想,但你仍然可以获得大量数据,而且数据足够准确,可以带来益处。”
2021年,使用Flickr的人数不如以往。但该平台为Edwards和他的团队提供了一个很好的入门集来测试他们的程序,因为Flickr专注于摄影,而摄影师倾向于在照片中输入更多细节,例如照片中出现的物品的标签,以及拍摄的时间和地点。Flickr还与公民科学应用程序iNaturalist相连,许多用户将iNaturalist比作“宝可梦Go”,但针对的是真实动物。
在这项研究中,Edwards和他的团队主要想关注算法是否能正确检测出照片中是否存在野生动物。“如果标记错误也没关系,”他说。“如果我们能做到这一点,我们以后就可以继续找出它是什么。”
结合Google API和国家生物多样性网络图集
研究人员使用了Google Cloud Vision API,它就像一个反向图片搜索引擎,可以返回描述照片内容的关键词或标签。谷歌此前曾与野生动物保护组织合作,创建了一个由AI驱动的云平台,可以帮助对图像中的动物物种进行分类。
然后,物种名称和图像与国家生物多样性网络(NBN)图集中的约1500种动物和植物进行匹配,该图集是包含英国物种分布信息的最大数据集。这项收集集中于代表性最好的物种以及最常见的入侵物种。
“我们利用谷歌生成了一堆标签,然后我们的编码进来确定:这是野生动物还是非野生动物?”Edwards解释说。“我们取标签和地点,我们的算法发现的是这是真实情况的可能性有多大。”
当然,Edwards和他的合著者们检查了算法的工作,有时会排除一些标签,以免算法被照片中非野生动物的物体分散注意力。他们每个人都手动检查了成千上万张图片,但总的来说,他们验证的结果似乎与分类器所说的相符。Google Cloud Vision API本身并不完美。例如,它无法区分10斑瓢虫和22斑瓢虫。它也无法区分某些外观相似的物种,例如杜鹃和雀鹰。
[相关:观鸟爱好者看过来:康奈尔大学的 Merlin 应用现已成为观鸟识别的一站式服务]
此外,一些奇怪的谜团需要人类大脑来解决。“斯旺西有一支名为‘Ospreys’的橄榄球队。斯旺西地区从未见过鱼鹰,突然间,我们收到了大量关于鱼鹰的标签,就像‘哦不!’,”Edwards说。但他们可以过滤掉这些标签,不将其视为野生动物出现,算法也会从中学习。
总的来说,人们最喜欢拍摄白天活跃的鸟类的照片,并且与NBN图集中的收集数据匹配度最高。算法最难识别的物种是入侵植物,如常春藤,它们通常依附在房屋或墙壁上。即使改变了标签,算法也似乎无法将注意力从这些大结构转移到结构上的植物。
在证明该算法能够通过公共Flickr照片以70-80%的准确率正确识别环境野生动物后,Edwards和他的团队正在考虑将其用途扩展到Twitter和Facebook等其他平台,但他认为这会有点挑战,因为“人们开始变得更加关注数据了。”
他想测试的另一个目标是看看该算法是否可以用于跟踪已识别物种随时间的变化。“你可以开始寻找它们的迁徙模式,并预测它们的轨迹,”Edwards说。“人们对此非常感兴趣,因为你可以通过动物的移动来预测气候变化,甚至在我们能看到它之前。”