素材来源 | google research blog
编译|Aileen 魏子敏
糖尿病性视网膜病变(Diabeticretinopathy,下称DR)是增长最快的导致失明的原因,全世界有近4.15亿糖尿病患者处于这种危险之中。如果早期发现,可以治疗该疾病; 如果没有及时发现,它可能导致不可逆的失明。不幸的是,在世界上糖尿病非常普遍的许多地方没有能够检测该疾病的医学专家。
在北京时间11月30日凌晨,谷歌团队在其blog上宣布,在美国医学协会杂志(JAMA)刚刚发表的一篇论文中,他们提出了一种能够解释视网膜照片中的DR迹象的深度学习算法,潜在地帮助医生在资源有限的情况下筛选更多的患者。
谷歌团队相关负责人称,他们希望通过机器学习,更好的帮助医生识别有这样需要的患者,特别是弱势人群。
以下为谷歌相关团队负责人关于该研究的介绍:
几年前,我们几个人开始思考是否有一种Google技术可以改善DR筛选过程的方法,特别是利用机器学习和计算机视觉方面的***进展。在今天发表在美国医学协会杂志(JAMA)的文章“用于检测视网膜眼底照片中的糖尿病性视网膜病变的深度学习算法的开发和验证( Developmentand Validation of a Deep Learning Algorithm for Detection of DiabeticRetinopathy in Retinal Fundus Photographs)中,我们提出了一种能够解释视网膜照片中的DR迹象的深度学习算法,潜在地帮助医生在资源有限的情况下筛选更多的患者。
检测糖尿病性眼病的最常见方法之一是让专科医生检查眼后部的照片(图1),并对疾病存在和严重程度进行评估。严重性由存在的损伤的类型(例如,微动脉瘤,出血,硬渗出物等)确定,其意味着眼睛中的出血和流体泄漏。解释这些照片需要专门的培训,在世界上许多地区没有足够的合格分级师来筛选出每个有此疾病风险的患者。
图1:用于筛选DR的视网膜眼底照片的示例。左侧的图像是健康的视网膜(A),而右侧的图像是具有可引起的糖尿病性视网膜病变(B)的视网膜,因为存在许多出血(红斑)。
我们与印度和美国的医生密切合作,创建了一个128,000张图像的开发数据集,每个由来自54名眼科医生团队中的3-7名眼科医生进行评估。该数据集用于训练深层神经网络以检测可引起的糖尿病视网膜病变。然后,我们在两个独立的临床验证集上测试算法的性能,总共约12,000个图像,以7或8个拥有美国专业委员会认证的眼科医生中的大多数意见作为参考标准。选择用于验证集的眼科医生是从原来的54名医生中正确率教高的眼科医生。
在图2中示出了算法和眼科医生在9,963图像验证集上的性能。
图2.在由9963个图像组成的验证集上,存在可引起的糖尿病性视网膜病变(中度或更差的糖尿病性视网膜病变或可疑的糖尿病性黄斑水肿)的算法(黑色曲线)和八个眼科医师(彩色圆点)的性能。图上的黑色菱形对应于在高灵敏度和高特异性操作点中,算法的灵敏度和特异性。
结果表明,我们的算法的性能与眼科医生的性能一致。例如,在图2中描述的验证集上,算法具有0.95的F-Score(综合灵敏度和特异性的度量,***值为1),算法性能略高于我们所咨询的8个眼科医生的F-Score中值(0.91)。
这些都是令人兴奋的结果,但仍有很多工作要做。首先,虽然用于评估我们的算法的常规质量度量结果是鼓舞人心的,我们正在与视网膜专家合作,以定义甚至更强大的参考标准,可用于量化性能。此外,我们在本文中证明的2D眼底照片的解释只是导致糖尿病眼病诊断的多步骤过程的一部分。在某些情况下,医生需要使用3D成像技术,光学相干断层扫描(OCT),详细检查视网膜的各个层。将机器学习应用于这种3D成像模式已经在DeepMind的同事的领导下进行。在将来,这两种补充方法可以一起使用,以帮助医生诊断更多的眼科疾病。
具有高精度的自动DR筛选方法有很大的潜力,以帮助医生评估更多的患者,并且快速地将需要特殊帮助的人发送给专家。我们正在与医生和研究人员一起研究世界各地的筛查过程,希望我们能够以最有利的方式将我们的方法整合到临床工作流程中。***,我们正与食品药品监督管理局(FDA)和其他监管机构合作,在临床研究中进一步评估这些技术。
考虑到深度学习的许多***进展,我们希望我们的研究只是众多引人注目的例子之一,证明机器学习能够更广泛地帮助解决医疗成像在医疗保健中的重要问题。
【本文是51CTO专栏机构大数据文摘的原创译文,微信公众号“大数据文摘( id: BigDataDigest)”】