谷歌研发AI系统，可使异常病例检测周转时间缩短28%-51CTO.COM

近日，谷歌团队的又一重大研究成果登上 Nature 子刊。该研究成果主要揭示了正常和异常胸片深度学习的区别，以及对结核病和 COVID-19 两种致病因子不明显疾病的概括。

值得关注的是，在人工智能系统优先处理异常病例的模拟工作流程中，异常病例的周转时间可以缩短 28%，这关乎人工智能评估系统是否可以安全地用于以前未见异常标记案例。

9 月 1 日，相关论文以《用于正常和异常胸片深度学习的区别以及对结核病和 COVID-19两种看不见疾病的概括》（Deep learning for distinguishing normal versus abnormal chest radiographs and generalization to two unseen diseases tuberculosis and COVID-19）为题发表在 Scientific Reports 上。

图｜相关论文（来源：Scientific Reports）

由谷歌健康团队成员丹尼尔·谢（Daniel Tse）、博轩·卡梅伦·陈（音译）（Po-Hsuan Cameron Chen）和什拉维亚·谢蒂（Shravya Shetty）担任共同通讯作者。

胸腔放射成像作为使用频率较高的胸腔临床成像模式，在指导心胸疾病管理方面具有至关重要的作用。一直以来，检测特定的胸腔放射异常（Chest Radiography，CXR）研究是多个人工智能系统的主要焦点。

图｜胸部X放射（来源：YouTube 视频截图）

然而，由于 CXR 异常范围十分广泛，每个人工智能系统都需检测一个或多个预先指定的条件。因此，试图通过制备数个单独的人工智能系统，检测每个有可能出现的情况与实际情况不相匹配。

面对这一挑战，该团队对人工智能系统进行了开发与深度评估，将 CXR 射线分为正常和异常两种。为了对 CXR 系统进行调整，该团队开发了一个深度学习系统（Deep Learning System，DLS），在印度五个城市的五家医院对约 2.48 万名患者做了数据集识别，他们还对印度、中国和美国的 6 个国际数据集做了 CXR 系统通用性评估。

图｜DLS 研究设计示意图（来源：Scientific Reports）

在这些数据集中，有四个侧重于 AI 未受过检测培训的疾病，另外四个分别是两个结核病数据集和两个 2019 年冠状病毒疾病数据集。该团队的研究成果表明，AI 系统可以使用包含各种胸腔放射异常的大型数据集进行培训，这些异常情况可以被分为新患者和症状不明的疾病人群。为了促进 CXR AI 模型的持续开发，该团队发布了他们收集的，用于公开提供数据集的标签。

该研究成果表明，可信赖的 AI 系统可区分正 CXR 的正常或异常状态，对于患者的日常锻炼和管理具有一定的益处。

首先，在放射科医生较大的审查情况下，AI 算法可用于识别不太可能患病的病例，帮助医疗保健专业人员能够快速地排除某些差异诊断，将更多的工作时间用于其他方向的疾病诊断。然后，将可能患病案例统一划分到一组，以便进行优先审查，进而缩短检测周转的时间。

其次，在大规模疾病爆发期间，当临床需求超过放射科医生可用性的环境中，这种人工智能系统可能被用作非放射科医生的前线护理点工具。更重要的是，需要对在开发过程中未遇到的异常 CXR 进行人工智能评估，以验证其对新疾病或新疾病表现的稳健性。

谷歌研究人员在论文中指出，在某些情况下，他们的深度学习模型在放射检测方面具有较大的优势，可以较大地提高放射科科医生工作效率。

该团队研究成员表示：“不论在相对健康的门诊实践，还是在异常繁忙的住院或门诊环境中，DLS 系统都有助于将异常的 CXR 置于优先级，以便快速地向放射科医生解释。

在这项工作中，该团队在一定的条件下，对这些有助于验证 DLS 的数据性能进行了评估，并使用相同的数据进行其他研究的基准测试。

为了更好地了解 DLS 在逆转录聚合酶链式反应 (Reverse Transcription-Polymerase Chain Reaction ，RT-PCR）灵敏度方面的潜在影响，该团队对 COVID-19 案例进行了更加详细的分析。该案例在初始测试中具有 “假阴性”RT-PCR 测试结果，定义为阴性 RT-PCR 测试，然后在五天内检测为阳性，在 21 个此类案例中，DLS 的灵敏度达到 95.2%。

图｜真阳性和假阳性的样本 CXR（来源：Scientific Reports）

为了解他们可发的 DLS 是具体如何帮助练习放射科医生的，他们调查了两个基于 DLS 的模拟工作流程。假设放射科医生尚未审查 DLS 阴性病例，并认为这些案例被解释为 “正常”，基于评估目的，其有效的即时表现令人满意。

放射科医生和按照顺序 DLS 放射科医生设置之间的性能差异很小，但 DS-1 和 CXR-14 的有效“紧急”案例量减少了 25%-30%，结核病数据集减少了约 40%，COVID-19 数据集减少了约 5-10%。

图｜DLS 放射性图谱（来源：Scientific Reports）

该团队开发的 DLS 可以解释 CXR 是否为异常，并用六个数据集进一步验证了它的适应性，其中包含两个广泛的临床数据集，两个未见疾病的数据集以及两个带有第二种未发现疾病的数据集。

总之，该团队已经开发并评估了一个与临床相关的，可用于胸部X射线检测的人工智能模型，并评估了其在 6 个不同数据集上的适用性。该团队希望，其研究成果中的性能分析以及公开可用的 CXR-14 图像的专属标签发布，可以促进临床 CXR 人工智能模型的持续发展。