GenAI正在帮助医疗机构提高生产力和推进临床护理,但其可靠性完全取决于训练所用的数据。这使得医疗数据治理变得愈发重要。
AWS和《哈佛商业评论》的一项新调查显示,多个行业的首席数据官都担心他们的数据资产无法胜任这项任务。根据该调查的新闻稿,52%的受访者认为其组织对GenAI的准备“不足”,39%的受访者表示数据问题是阻碍他们有效扩展AI应用的首要挑战。
然而,AWS的企业战略师托马斯·戈登表示,医疗行业的监管框架使其在发展AI方面具有独特优势。“数据治理从根本上说是确保患者安全的基础,”曾担任Foundation Medicine首席信息官的戈登说道,“医疗机构已经需要对数据进行清理和控制。因此,在很多方面,它们比其他行业更有条件发展AI。”
为何AI使医疗数据治理更加复杂?
数据治理是指确保数据高质量、易于访问、安全且可信的政策和标准。跟踪和维护AI支持的技术所需的大量数据,在几个关键方面使医疗数据治理更具挑战性。
常见挑战包括:
保持数据集更新
医疗数据不断变化,AI训练模型必须反映这些变化以确保准确性。“如果你不是每天或每周更新模型,你就会错过世界上和患者身上发生的事情。”戈登说道。
消除偏见
数据可能包含与性别、种族和社会经济地位等因素相关的偏见。Quest Software的首席现场技术专家苏珊·莱恩表示,数据团队必须建立系统来识别并从训练数据中消除这些偏见。“当这些数据被输入AI用于诊断和治疗建议时,数据问题只会被放大。”她警告说。
明确责任和问责
如果AI驱动的决策导致不良结果,那么责任应由开发者、用户还是系统本身承担?“如果你对数据的处理情况缺乏透明度,那么你就无法知道问题的真正来源或需要修复的地方。”莱恩说道。
AI和数据治理有何益处?
稳健的数据治理框架确保AI模型接收高质量的信息,从而降低风险。“数据治理就像给AI套上一个玻璃盒子,”莱恩说道,“它提供了对AI模型输入数据的透明度,以及谁接触过这些数据。”
同时,AI本身也可以改善数据管理。它可以用于政策执行和安全模式分析。例如,AI可以监控和验证敏感患者数据是否被正确访问和处理。
聊天机器人可以通过帮助分析师更高效地排序和解释大型数据集中的信息,来增强终端用户体验。
此外,机器学习工具可以帮助医疗机构利用更大量的数据涌入。AI自动处理并从其收集的数据中学习,这使系统能够持续改进。
组织如何对AI数据治理设定现实期望?
戈登表示,一个常见的挑战是领导者认为他们需要先振兴组织的所有数据集,然后才能从AI工具中生成价值。相反,他鼓励他们调整期望,并从小目标开始:“识别一个商业机会,并专注于治理和清理解决该特定问题所需的数据。”
明确定义组织的价值观并确保员工理解这些价值观至关重要。这提供了必要的指南,以便当数据异常发生时,员工能够按照公司的期望正确识别并修复它。“AI模型会有偏见,而修正将取决于个人做出价值判断。”莱恩说道。
她补充说,医疗系统需要记住AI并不完美。人为干预至关重要,尤其是在确定数据异常发生的原因时。“如果我是医生,知道有一个数据治理团队在幕后验证数据的合理性,我会感到更安心。”莱恩说道。
谁应主导AI数据治理工作?
首席数据官通常主导治理工作,并得到数据质量分析师和架构师的支持。现在,还使用提示专家来更好地训练AI训练模型。
莱恩强调,在开始AI和数据治理工作时,数据管理专业人员应该帮助引领方向:“这些人是了解数据如何移动和变化的人。我认为依靠他们的专业知识是组织正确实施的关键。”
戈登补充说,在建立医疗AI项目时,应该有一个多元化的团队参与制定管理该技术的政策和程序。这包括IT和数据团队、医疗专业人员以及来自法律、营销和人力资源部门的人员。
“你需要让参与构建和使用AI的每个人都理解它并保持警惕,”戈登说道,并指出所有团队成员都有责任监控AI以发现不一致之处。“这不仅是一个IT问题,而且是每个人的问题。”