

只要给计算机足够多的照片和正确的算法,它就能学会“看”。如果照片显示的是眼睛受损的情况,那么计算机就能学会诊断眼疾,甚至比人类做得更好。
糖尿病患者经常会患上一种叫做糖尿病视网膜病变的疾病,这种疾病会导致他们眼底(视网膜)的小血管受损并开始渗漏。大约有三分之一的糖尿病患者会出现这种损伤,如果不及时治疗,可能导致永久性失明。然而,如果能及早发现,这种疾病是可以很好治疗的。
问题在于,许多人无法获得眼科医生的诊断。全球有3.87亿糖尿病患者需要专科医生的帮助来及早发现这种疾病,而我们现有的预防措施效果并不理想——糖尿病视网膜病变是工作年龄人群视力障碍和失明的主要原因。
因此,谷歌设计了一种利用深度机器学习来训练神经网络的方法,让它 从患者眼部照片中检测糖尿病视网膜病变。他们于周二在美国医学会杂志上发表了他们的研究成果。
神经网络有点像一个人造大脑,虽然很简单。通过向其展示大量患有或未患有视网膜损伤的患者图像,工程师可以训练网络区分病变和非病变的眼睛。训练完成后,谷歌团队测试了该神经网络,看它是否能像同样看过这些图像的眼科医生一样检测糖尿病视网膜病变。
谷歌的算法表现略优于人类眼科医生,这表明神经网络未来有望帮助筛查患者,或者至少协助医生进行诊断。
医生们已经在使用一种类似的技术来帮助诊断心脏病和某些癌症等疾病。虽然目前的技术不如谷歌新开发的深度学习算法先进,但它们基于相同的原理。医生通过查看X射线或CT扫描等身体图像来识别心脏病中的动脉阻塞或癌症中的异常生长。图像专家——放射科医生——需要多年的经验才能看懂照片并找出问题区域。
但人眼的视觉能力有限,而且人容易犯错。如果计算机也能做同样的事情,它或许就能超越人类发现癌变或血管阻塞的能力。合乎逻辑的解决方案是教会计算机识别哪些是异常图像,哪些是正常图像。这似乎很简单——毕竟,人类理解图像很容易。

麻烦在于,对于计算机来说,理解图像比人类大脑困难得多。如果你给计算机看上面这张照片,它实际上看到的只是一系列带有特定颜色赋值的像素。而你,则看到的是海滩和一位女士。你能认出她的太阳镜和帽子。你知道她在跳跃,穿着一件带小碎花的绿色比基尼,而且天色阴沉。计算机却一无所知,除非它具备了计算机视觉能力。
计算机视觉是一种教计算机“看”的方法,让它们能够查看图像并识别出一个人正躺在海滩上,穿着紫色的泳裤。计算机目前协助诊断患者的方式就是一种基础的计算机视觉形式,但它只能辅助这一过程——还不足以取代人眼。
谷歌有潜力改变这一点。它们在计算机视觉领域已经非常出色,部分原因在于它们拥有海量的数据。你可以亲自看看它的效果,因为谷歌已经将其计算机视觉技术用于整理你的个人照片。如果你现在打开 Google Photos(假设你有一个谷歌账户,你很可能就有),你就能看到该系统已经编目的所有照片,并通过关键词进行搜索。试试搜索“雪景照片”或者,更好的是,“狗狗照片”。搜出来的照片会有雪景和狗狗,不是因为有人给这些照片打上了文本标签,而是因为谷歌的计算机视觉算法已经识别出了图像中的雪和狗。
糖尿病视网膜病变是谷歌为其 深度学习计算机视觉团队 找到的第一个诊断应用之一。其他团队也已经在进行类似的项目。康奈尔大学有一个 视觉与图像分析小组 正在研究利用计算机视觉来诊断肺病、心脏病和骨骼健康问题。一个芬兰的研究小组正在研究如何 通过血样图像诊断疟疾,而IBM则投入多年开发 一种检测皮肤癌的算法。
有一天,计算机视觉和深度学习可能会 改变医生诊断患者的方式。但目前,美国食品药品监督管理局(FDA)尚未批准在医疗领域使用此类技术。如果这是未来的发展方向,他们将不得不找出如何安全地监管神经网络。在此期间,你可以利用谷歌的计算机视觉能力来查找你家狗狗的照片,并将它们 变成噩梦。也许没那么有用,但也不失为打发时间的好方法。