数据科学和人工智能将如何改变医疗保健行业?-人工智能医疗

数据科学、机器学习和人工智能有可能以深刻的方式改变医疗保健行业。在本期采访中，皇家飞利浦(Royal Philips)首席医疗、创新和战略官Shez Partovi博士为我们介绍了这些技术在改善患者治疗效果、诊断疾病等方面发挥的重大作用。

对话包括以下主题：

关于健康科技公司飞利浦。
数据在医疗保健转型中的作用。
在医疗保健转型中重新思考数据分析的必要性。
医疗健康转型中的数据收集和数据来源。
将医疗保健中的数据科学应用与改善患者治疗效果联系起来。
为医疗保健的数据共享创建激励措施。
在数据科学中选择正确的问题来解决。
避免以数据为中心的医疗保健中的偏见。
基于医疗保健数据孤岛的患者锁定。
谁应对不良数据、算法和患者治疗结果负责。
医疗保健中数据和人工智能的未来;

2021年3月，Shez正式担任全球领先的医疗技术公司皇家飞利浦的首席创新和战略官，负责领导首席技术办公室、研究、HealthSuite平台、首席医疗办公室、产品工程、体验设计和战略等。同时，创新和战略组织还与运营业务及市场合作，负责指导公司战略，以满足客户需求并推进业务的增长和盈利目标。

据悉，Partovi的职业生涯始于1998年，曾担任the Barrow NeurologicalInstitute的神经放射学家，一直从事临床实践直到2013年。此后，Partovi在美国第五大医疗系统DignityHealth中工作了20年，于2018年加入亚马逊并担任医疗保健、生命科学和医疗设备业务开发的全球主管，负责亚马逊全球范围内的市场推广工作。

除了在蒙特利尔的麦吉尔大学接受过医学培训外，他还拥有计算机科学的研究生学历。他帮助在亚利桑那州立大学创办了生物医学信息学系，并在那里担任了三年的临床教授。

采访摘录：

关于健康科技公司飞利浦

Michael Krigsman(主持人)：数据科学和人工智能正在改变医疗保健行业。下面有请皇家飞利浦首席创新和战略官ShezPartovi为我们做简单介绍。

ShezPartovi：七年前，飞利浦决定剥离医疗保健以外的所有业务，现在它已经完完全全是一家健康科技公司。也就是说，虽然你可能仍会看到飞利浦照明，但它实际上只是挂牌生产。飞利浦本身现在是一家100%的健康科技公司，专注于持续护理，包括家庭、门诊、住院等。

所以，现在提到飞利浦，请将其视为一家健康科技公司。这是一家拥有130年历史的“初创”公司，因为它在10年前才真正实现了自我转型，所以它就像一家拥有130年历史的初创公司。

MichaelKrigsman：据我所知，你是一名医生。现在你又是飞利浦的首席创新和战略官。你能简单介绍下你的角色、你所做的工作以及你的关注重点吗?

ShezPartovi：我拥有世界上最好的工作之一，因为我开始从事战略方面的事务。我开始与客户合作，了解他们未满足的需求，并从客户的问题出发，与同事一起制定战略，让飞利浦能够真正为客户解决这些问题。这就是战略方面的意义。

然后说创新方面，当我们听取客户的意见以及问题时，我们必须清楚如何从他们的角度进行创新来解决这些问题?飞利浦内部的整个创新社区都是我职责的一部分，我们所做的就是倾听客户需求，观察市场趋势，然后探索我们拥有的或飞利浦外部的技术，并将其整合起来，以便能够满足客户需求。

这项工作的核心就是倾听客户、获取信号、制定策略，然后传达给创新团队：“我们如何创造性地满足客户需求?我们如何从他们的角度进行创新?”然后带着这些主张付诸实践。这就是我领导的团队，我认为这是我做过最棒的工作。

数据在医疗保健转型中的作用

Michael Krigsman：我知道你的很多工作都集中在数据上。你能解释一下它在医疗保健转型中的作用吗?

ShezPartovi：我们现在在医疗保健领域进行了大量的数据创建和数据生成工作。当然，愤世嫉俗的人会说，“嗯，是的，其中大部分仅用于计费方面。”

尽管有这种观点，但现在绝大多数数据都是数字化的，这也是事实。例如，当你使用剪切板在线填写内容时，这意味着数据已经数字化。而数字化的机制和过程不一定是无缝和无摩擦的，其中可能有很多重复的、琐碎的任务。

当人们谈论临床医生职业倦怠、医生和护理职业倦怠时，部分原因在于，虽然我们正在进行数字化转型，但它们不一定是以一种无摩擦的方式进行的，它们往往没有工作流程意识，且是重复的。这并不是最佳的数字化过程。

然后回到数据创建和生成问题上，有些人会争辩称，我们并没有以一种非常惊喜的方式有意义地使用这些数据。我们可能拥有丰富的数据，但缺乏洞察力。

A)我们以一种充满摩擦的方式来创建数据。B) 遗憾的是，我们并没有真正从这些数据中创造出令人深刻的见解。从我的角度来看，这就是我们需要努力的地方。

在医疗保健转型中重新思考数据分析的必要性

Michael Krigsman：导致你提出上面两个基本问题的原因是什么?

ShezPartovi：我们面临着一些挑战。第一，生成的数据现在仍然更多的以应用程序为中心，这意味着它们处于孤立状态。我记得当我在卫生系统工作时，我们有大约1500个应用程序。现在想象一下你正在数字化数据，这些数据存在于应用程序环境中，但你有1500个应用程序。

第二，缺乏数据流动性，这意味着虽然你已经将数据数字化并存放在磁盘上，但你不一定能够将其组合到一个环境中，并从中获得洞察力。面对如此多孤立的环境，我们有很多工作要做，以实现所有数据一起形成一个共同的环境，从中产生洞察力。

当然，科技也在进步。飞利浦有一个名为“Health Suite”的环境，它与数据流动性有关。它能够从数百个不同来源引入数据，并将数据组合起来，然后从中获取洞察力。

这就是我们所做的事情。事实上，许多卫生系统目前都苦苦挣扎于将数据整个到一个共同环境中。

医疗健康转型中的数据收集和数据来源

Michael Krigsman：看来，数据流动性和互操作性似乎仍然是众多数字活动领域的瓶颈。是这样吗?

Shez Partovi：是的。实际上，你应该将数据互操作性视为两个维度：只是共享数据的语法互操作性(syntactic interoperability)，以及共享含义的语义互操作性(semantic interoperability)。

确实，我们仍存在很多数据孤岛，但不可否认，我们在数据互操作性方面也取得了很大进展。随着发生越来越多的互操作性，一些组织已经产生了流动性，由此也催生了从数据到信息、从信息到知识、从知识到洞察力的愿景。这正是人工智能可以发挥作用的地方。

Michael Krigsman：你如何从刚才描述的数据丰富(data-rich)转变为数据驱动?

ShezPartovi：我可以举一个从数据到信息、信息到知识、知识到洞察力的例子。让我们从一个单一的数据点开始，比如血糖值。如果你的单次血糖值约为每分升140毫克，那就很高了。但另一方面，这是因为那个人刚刚吃过饭吗?是空腹血糖吗?是非空腹血糖吗?所以说，它只是一个数据点。有用，但还不具备洞察力。

但如果我告知你的是血糖的上升趋势，那这就属于信息了。信息就是趋势，这种趋势正在上升，意味着你的身体可能出现了一些问题。

如果我们进一步查看患者的病史并了解其可能是糖尿病早期患者，这就属于知识。但是今天，为了以积极的方式实现三重目标——提高质量、降低成本和改善体验——我们需要了解卫生系统需要什么，临床医生、医生、护士和组织需要什么，他们想要的不仅仅是数据、信息或知识。

他们想要回答以下问题：你给我看的这位患者的血糖是糖尿病前期的可能性有多大?他们在接下来的18个月内发生充血性心力衰竭的可能性有多大?他们在未来两年内患糖尿病足溃疡的可能性有多大?

这种预测，这种对未来的洞察力，才是真正的机会。当你将数据整合在一起并能够使用它来构建机器学习模型和使用AI时，才算是真正地使用数据来驱动组织的洞察力。

这就是主线：从数据到信息到知识，再到观察力，最后到某种对我来说可行的事情。在这个服务点的这个时刻，我可以为这位患者提供的最佳服务。

将医疗保健中的数据科学与改善患者治疗结果联系起来

Michael Krigsman：你如何将这一切与患者治疗结果联系起来的?或者说，如果我们拥有这种互操作性，有什么优势?

ShezPartovi：我会把一切都归结为上述提及的三重目标，即提高护理质量，降低护理成本，以及改善临床医生或患者的临床体验或消费体验。例如，从我认为可能最容易的降低成本开始。

将人工智能与数据结合使用可以做的一件事是帮助进行所谓的现实运营预测，例如，下周五晚上我的急诊科需要配置多少员工才合适?病人流量是多少?我可以预测进入医院的患者流量，以便调整员工人数吗?顺便说一句，这会影响护理质量，因为如果你人手不足，将会是一个挑战。调整规模既是对成本的积极影响，也是对护理质量的积极影响。

例如，使用ADT流(入院、出院、转移流)来构建一个模型，为进入医院的患者流量提供预测，进而帮助你实现合理的人员配置，这不仅会影响患者的体验，也会影响临床医生的体验。因为如果人手不足，无疑会影响护理质量。这正是飞利浦目前正在做的事情。

上述是运营预测，下面让我们聊聊之前提到的临床预测。我以糖尿病为例，预测糖尿病足溃疡或心脏病的可能性。事实上，临床预测还有很多实例。

例如，你可以使用人工智能和机器学习来阅读放射科影像，以识别或预测异常。如果算法认为一个影像应该尽快处理，因为它会对护理质量产生影响，那么放射科医生应该立即进行查验并采取积极的行动。该算法并非按照影像拍摄的顺序来排列它，而是会把存在异常的影像排在首位。先发现先治疗，才能产生积极的治疗结果。

在飞利浦，这些就是AI和ML对于改善患者治疗结果最常见的用例。

为医疗保健的数据共享创建激励措施

MichaelKrigsman：大量数据保存在极少数市场领先的应用程序中。为什么垄断企业会有分享这些数据的动机?换句话说，软件和基础设施的市场力量难道不影响你所描述的那种数据共享吗?

Shez Partovi：这些数据属于卫生系统，软件公司实际上并不拥有这些数据。例如，飞利浦不拥有这些数据，我们本质上只是数据管理者。

不过，我确实知道世界上有些国家(我不想说出它们的名字，因为我不想说它们坏话)的软件公司实际上拥有这些数据。因此，也可以说你的这个论点是正确的。

但至少在美国，说“我拒绝分享数据”是不正确的。信息屏蔽(Information blocking)规则将禁止这样做。

Michael Krigsman：你能告诉我们需要汇总的数据类型吗?

ShezPartovi：如果你正在考虑AI和机器学习、临床预测和运营预测，你需要从问题出发才能了解需要哪些数据。以谷歌地图为例，如果你还记得的话，有一段时间它只是用红色热图向你显示方向和耗时。后来，它开始显示骑行耗时、步行耗时、最佳路线等等。根据他们想要提供的预测和价值，他们正在收集越来越多的数据。

现在回到企业本身，当考虑需要收集哪些数据来创建模型时，我们同样需要从问题出发。假如你想预测逗留时间，以保持适当和高效的护理规模。那么你可能需要的只是一个ADT流来预测逗留时间。另一方面，如果你试图预测一个人是否患有特定疾病或特定癌症，你可能需要成像、血液值、EHR(电子病历数据)数据。

总之，你需要从问题陈述开始，了解你试图预测的内容，以及你想为临床医生或运营团队提供的工具，然后逆向思考，看看你需要哪些数据才能构建这种为你提供预测的模型。

在数据科学中选择正确的问题来解决

Michael Krigsman：你如何确保选择正确的问题来解决?

Shez Partovi：每个组织要么有试图解决运营问题的运营人员，要么可能有一个精益团队。精益团队前一阵子真的很流行。现在又有转型团队。

虽然他们名称不同，但他们都在四处搜寻需要解决的问题。当然，还有临床卓越团队以及运营卓越团队。只不过，在你的组织中，它们可能有不同的称呼。

如果你参加他们的指导委员会会议，你会发现他们可能知道自己需要解决的问题以及头疼的问题。事实上，这些都是客户告知他们的。所以，我会建议从这些已经着手部署计划的团队开始，例如，首席护士官或首席医疗官正在运行一个临床卓越计划;首席运营官正在运行一个运营精益计划或卓越计划。他们正试图解决一些挑战。所以他们有数据可以建立机器学习模型，以作为解决这些问题的工具。

我想说的是，如果我是卫生系统的首席营销官(CMO)，我当然会面临许多需要解决的问题，但我会从那些已经在研究中的问题入手。同时，考虑使用AI和ML作为这些团队的工具。

避免以数据为中心的医疗保健中的偏见

Michael Krigsman：换句话说，就是解决你可能面临的直接实际问题，无论是临床方面还是手术方面。对吗?

ShezPartovi：当然。我的意思是我现在很实际。它可能与组织的KPI一致，与团队KPI一致。这确实是最简单、最直接的起点，就是从这些事情开始的。

Michael Krigsman：成为一个更加以数据为中心、更有效地利用数据的医疗保健系统所面临的挑战是技术偏向运营方面吗?

ShezPartovi：首先，你当然需要数字化数据。就数据而言，存在三个V：大量化(volume)、多样化(variety)和真实性(veracity)。想要真正创建作为一种保护工具的模型，你需要实现这些特质。因为大量化有助于消除偏见;多样化能够创建更好的机器学习模型;真实性还原数据的真相。

这是第一步。接下来，你需要实际训练一个模型，你需要标记数据，并对模型进行验证。此外，你还需要决定是否要申请美国食品和药品管理局(FDA)审查(例如Philip就申请了FDA审查)，你不仅需要验证它，还需要满足某些要求。

进行结果研究以证明确实如此。同样，这更多的是在供应商方面。在内部，对于运营，你不需要这样做。

数据(大量化、多样化、真实性)、标记、机器学习、建模、测试和验证等等，所有这些活动都需要组织与健康科技公司合作。对于一些复杂的学术医疗中心来说，他们还会与大学联系，寻求需要的人才来帮忙。

当你问我存在哪些障碍时，这取决于你是否正在实施可能从飞利浦获得的工具，或者你是否想要自己动手构建这些工具。在这种情况下，你可能会与一家可以帮助你的健康科技公司合作，或者与某种可以帮助你的公司合作，或者你可能会决定建立一种内部能力来做到这一点。

工具就在那里。但想要将这一切集成在一起需要能力、培训和技能提升。因此，你要么在内部构建它，要么与你的合作伙伴合作。

Michael Krigsman：一个组织如何才能在数据来自各种记录系统时创建一种企业范围的视图?毕竟来自不同的软件供应商，本质上是不同的系统。

ShezPartovi：你希望你的数据处于一个所有数据都汇集在一起的环境中。从技术上讲，至少，你必须考虑到你确实需要一个保持区，称之为“数据湖”，或者随便你怎么称呼它，总之是一个健康数据空间。

提问者提到了可视化的问题，我认为这种重要。上面我说过数据、信息、知识和洞察力的问题，如果你还记得的话，可视化是我将数据转变为信息用到的术语。

人们习惯将可视化与“显示仪表板和图表”联系起来。但我认为更强大的东西，很可能是问题中所暗示的，是我如何从这些数据中创造洞察力，这能获得比简单的可视化更高的投资回报率。顺便说一下，我认为你确实需要某种数据湖环境，最好是在云中，因为如果你要运行机器学习模型，你一定不想购买位于数据中心的昂贵GPU，每天只用半小时，让它空闲23.5小时。

你可以使用云，并基于所使用的内容付费。在云中，你可以使用最复杂的机器学习模型训练集、训练技术，并且只为你使用的部分付费。如果你尝试在自己的数据中心中构建它，你将需要为只使用一小部分时间的东西支付高昂的费用。千万不要那样做。

基于医疗保健数据孤岛的患者锁定

MichaelKrigsman：告诉你关于我个人的一个小故事，我不会说明具体的医疗保健系统名称，但我绝对会坚持使用它们。原因有很多，其中之一是它们很棒，很棒的医生等等。但它也存在信息锁定，如果我离开它们的系统，医生就会给我发通知。这种内在的信息锁定会不会不利于你所描述的数据共享。

ShezPartovi：这绝对会加剧数据共享的困难度。不过，很多组织正在试图摆脱这种现状。举个例子，我们的合作伙伴加州大学旧金山分校(UCSF)正在使用我上面提到的通用共享环境，他们实际上是从UCSF环境之外的实践中获取数据，并试图创建一个整体视图，使患者在实践之间的移动变得简单而轻松，信息共享也变得简单而轻松。

谁应对不良数据、算法和患者治疗结果负责

Michael Krigsman：如果有错误的数据、错误的算法以及由此做出的错误预测，谁应该负责?

Shez Partovi：在飞利浦，我们继续相信这是一种帮助临床医生做出决策的工具，但最终你希望让临床医生成为最终的决定者。

回到问题本身，首先，从哲学上讲，至少从我们的角度来看，我们正在研究如何创建一个透明、公正且改善体验感的工具，这个工具同样可以帮助临床医生完成他们的工作，就像验血或任何其他测试一样。

顺便说一句，任何测试都可能出现假阳性或假阴性。临床医生会通过他们的验证，综合考虑做出决定，这与算法自行诊断不同。无论是数据、算法还是预测，它们都只是帮助临床医生决策的工具。

然后，谈到数据偏见，我会在之前的3V(大量化、多样化、真实性)基础上加上1V，验证(validation)。当然，创建算法的过程包括这种大量化、多样性、真实性，然后是验证。

事实上，作为临床医生，我们都将医疗保健视为本地医疗，这意味着在一个地区流行的疾病可能不会在另一个地区流行。我曾在加拿大和美国都接受过培训。我可以告诉你，加拿大的某个特定胸部X光片是肺结核，而我在美国接受培训的同样发现是肺球孢子菌病。他们是不同的。但这是因为医疗保健是本地的。

算法需要根据部署环境进行微调。世界上不会有一种通用算法，更不用说美国了。医疗保健是本地的。培训需要在当地进行微调。

Michael Krigsman：你提出了一个非常具有挑衅性的观点，即模型需要本地化或反映当地情况。谁应该负责创建这些模型?

ShezPartovi：算法可以微调——我们也是这样做的。因此，一个模型可以“一般地”训练和微调，甚至在投入生产之前部署在环境中的后台，然后在部署后继续训练。

根据定义，它通过其实施和持续使用变得本地化。

Michael Krigsman：这些模型通常会由软件供应商、医疗保健系统或飞利浦等公司提供吗?谁将提供这些模型?

Shez Partovi：以上所有皆可提供。当然，飞利浦也会开发模型，我们实际上有一个称为“AIManager”的环境，你可以将我们的模型放在该管理器中并使用它。

组织也可以自行构建模型并将其放入AI Manger中使用。目前，有许多年轻的公司这样做。我认为有权访问数据的公司都可以使用良好的数据构建模型。

Michael Krigsman：你的意思是本地模型是减少模型内部偏差的一种途径，我理解的正确吗?

Shez Partovi：是的，它确实有助于减少偏差，经过训练和验证的模型在进入本地并开始使用后，它就算是本地优化调整模型。

医疗保健中的数据和人工智能的未来

Michael Krigsman：在接下来的几年里，医疗保健中的数据和人工智能将走向何方?

ShezPartovi：当你拿了一些机体组织、血液进行测试就会产生数据流，你可以获取数据并在其上运行算法作为测试。那么，就像你进行抽血并对血液进行测试一样，你可以让你的数据流经卫生系统的静脉和动脉。你可以获取该数据并对其应用算法。

临床医生将订购算法用作测试。是的，有总是运行的后台算法。但有些算法可能会需要使用大量计算能力。这种算法实际上最终可能带来成本支出，因为你正在使用计算能力来运行它们。

我认为，随着时间的推移，临床医生会像订购测试一样订购算法。

Michael Krigsman：你预测这种情况需要多久到来?

Shez Partovi：我认为可能会在五到十年内看到一些早期迹象。

Michael Krigsman：我们如何确保数据科学被用于改善患者护理，而不仅仅是提高利润?而且技术非常昂贵，应该如何考虑?

ShezPartovi：人们应该正确看待医疗保健中的AI和ML技术对于提高质量、降低成本和改善体验的综合意义。实际上，可以看到，成本只占这些因素的三分之一。我们应该将重点放在三重目标的各个方面，而不仅仅是降低成本。

我之前确实说过“数据科学用于提升运营效率”的话，但在我看来，在某些情况下，提升运营效率就是改善护理服务，因为例如，人手不足会导致护理质量差。这些因素都是捆绑在一起的，我不想让人觉得这些因素是分开的。

MichaelKrigsman：你对关注这一不断变化的环境的医疗保健管理人员有什么建议?他们知道自己需要适应，但这对他们来说非常艰难，因为他们承受着如此巨大的财务压力、监管压力以及各种不同的压力。

ShezPartovi：这一点我在早期与其他组织合作的过程中深有体会。我知道这听起来很自私，因为我在这里代表的是飞利浦，但如果我是CMO，我会进行培训和技能提升以及其他许多事情。

而我对管理员的建议是，针对自身存在的问题，寻找同行最佳解决方案并引入一个技术合作伙伴，看看如何将AI ML与这个合作伙伴一起应用到这个问题上。这就是我作为管理员的行事方法。

Michael Krigsman：你希望政策制定者了解这个不断变化的医疗保健世界吗?

Shez Partovi：政策制定者应该而且需要了解。AI和ML在推进三重目标方面发挥着重要作用。因此，在我看来，在当今时代，AIML可以为患者和临床医生提高质量、降低成本并改善体验。

政策制定者应该研究如何推进数据科学的采用，并消除AI和ML的障碍，因为这样做的净效应(neteffect)是其他团队想要的。这三种目标是彼此关联的，我们应该弄清楚如何通过政策推进实践。