为什么信不过AI看病?数据集小、可靠性差,AI医疗任重道远

开发 开发工具 人工智能
近年来,AI 在医疗诊断中的应用受到了越来越多的关注,也出现了一些实际的应用场景,如药物筛选、AI 诊断。但似乎正确的 AI 医疗诊断难以实现,这是哪些原因造成的呢?本文探讨并汇总了人们对 AI 医疗诊断的一些独到见解。

近年来,AI 在医疗诊断中的应用受到了越来越多的关注,也出现了一些实际的应用场景,如药物筛选、AI 诊断。但似乎正确的 AI 医疗诊断难以实现,这是哪些原因造成的呢?本文探讨并汇总了人们对 AI 医疗诊断的一些独到见解。

[[392053]]

AI 与医疗融合作为近年来兴起的一种新领域,具有巨大的发展潜力。用于医疗的 AI 算法正在不断涌现,在看到领域前景的同时,我们也发现了一些问题。

例如,为了协助医生筛查潜在新冠患者,AI 领域的研究者们研发了多种机器学习算法,以根据胸部 X 光片和 CT 图像快速准确地检测和预测新冠肺炎。然而,剑桥大学的一项研究发现:这些算法存在严重的算法缺陷和偏见,无法用于实际的临床应用。

实际上,致力于 AI 与医疗融合的研究者并不在少数,也有很多项目为此投资,但该领域仍然存在一些实际问题。近日,Reddit 上的一篇帖子将 AI 医疗与 AlphaZero 进行了对比,引发了关于 AI 医疗问题的诸多讨论。

数据集小、需要认证、容错成本高……

有网友从数据集大小、人机交互、认证和容错成本四个方面与 DeepMind 的 AlphaZero 进行了全方位的对比,指出了现有 AI 医疗诊断系统存在的一些基本问题。

首先,医疗数据集一般不太大,这是医生注释成本高昂造成的。此外,医疗过程也非常缓慢。例如,一台核磁共振机器每小时最多只能进行两次扫描,每天至多 48 次,每年不到 20000 次。如果存在 20 种疾病,分摊下来每种疾病只能得到 1000 张扫描图像。如果想要从多家医院收集数据,每家医院走流程都可能花费数月时间,并且研究人员也没有大把的时间来填写不同的表格。相比之下,AlphaZero 的数据收集就容易多了,只需要进行游戏,每小时就能生成数百万个数据。

关于这一点,有其他用户深表赞同。ta 曾见过一个 MRI 数据集,首先由 3 个医生进行标注,然后由领域专家重新检查,这一过程就需要大量的时间。

其次是人机交互方面,至少在可预见的未来,医疗诊断系统需要人类医生的参与。所以,除了进行预测之外,医疗诊断系统还应该输出置信度、其他可能的结果以及任何有用的辅助信息。在很大程度上,如何正确处理这些仍是一个未解决的问题。而 AlphaZero 只需要输出单一动作就行了。

再次,认证。你需要向决策者或医疗许可委员会「证明」医疗诊断系统有效。目前,解释神经网络仍是一个悬而未决的问题,一些人甚至质疑是否存在解释的可能。AlphaZero 不需要任何批准认可,只需在游戏服务器上部署或者找人类玩家测试就行了。

[[392054]]

最后,容错成本。如果医疗诊断系统出错了,研发者可能会面临数百万美元的索赔。因此,你必须保证系统运行正确。AlphaZero 在围棋游戏中输了,那真是太糟糕了,仅此而已。

医疗诊断不是「一锤子买卖」

除了数据集大小、医疗认证、容错成本等这些宏观的问题,有网友还提到了另一个问题。不同情况的病患可能在诊断图像上呈现出完全相同的症状,因此医疗诊断系统有时可能会做出误判。

[[392055]]

此外,不同机器或不同成像装置生成图像的分布有时大不相同,在一台机器上正常运行的算法可能完全不适用于另一台机器。可解释性也是一个问题。即使你的算法给出了正确的医疗结果,医生也往往会询问算法如何给出结论的。

的确,诊断是一个极其困难的 AI 或 ML 问题。病患的情况远不止一种,也会出现不同的症状。因此,除了医疗诊断系统的初次诊断之外,还需要为进一步诊断、治疗方案、预后以及康健日程等提供智能支持。

作为与健康安全息息相关的领域,AI 医疗的可靠性是最重要的一个问题,但却经常被忽略。即使是病理样本分析,也常常存在一定程度的不确定性。仅对图像加标签会引入各种偏见。即使经过多位专家达成共识,结果也会是如此,并且这还会导致成本的成倍增加。

医疗保健方面的问题非常复杂,AI 目前更适用于日常生活,而不是提供医疗上的最终诊断和预测。有位医生网友表示:「在 AI 医疗领域发表的大部分论文是完全没有用的,但这些研究提供了很多可能性。未来几年,这一领域中炒作宣传的泡沫将会破裂,并且将会由相关法规提高临床实践中引入 AI 工具的门槛。目前,已经有一些产品获得了 EU 或 FDA 支持,但尚不存在临床支持。」

看来,将 AI 真正用于医疗还有很长的路要走。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/mkol81/why_are_correct_ai_medical_diagnoses_seemingly_so/

【本文是51CTO专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】 

戳这里,看该作者更多好文

 

责任编辑:赵宁宁 来源: 51CTO专栏
相关推荐

2010-12-28 19:50:21

可靠性产品可靠性

2017-06-23 18:25:51

kafka数据可靠性

2022-11-24 15:06:48

AI情感AI

2019-08-30 12:10:05

磁盘数据可靠性RAID

2011-05-25 19:31:07

Stratus信息化

2010-12-28 20:16:24

2015-06-09 14:04:04

2024-09-12 09:16:11

2024-03-20 09:00:00

人工智能AI大模型深度学习

2016-12-22 15:27:22

数据中心NFV运营商

2009-04-08 10:23:00

软交换网络可靠

2017-08-15 10:20:08

Surface微软消费者

2013-11-04 17:04:22

容错可靠

2020-12-06 14:51:23

物联网可靠性IOT

2010-12-28 19:55:20

软件架构可靠性

2024-05-09 08:04:23

RabbitMQ消息可靠性

2015-12-28 10:27:18

数据中心电网

2010-12-28 20:04:10

网络的可靠性网络解决方案可靠性

2024-04-16 17:41:01

人工智能大型语言模型

2024-02-28 10:26:04

物联网数据存储
点赞
收藏

51CTO技术栈公众号