数字孪生的核心优势在于集中捕捉数据、提升反馈获取效率并实施有效干预,从而彻底颠覆我们所熟知的整个医疗保健思路。但完成这一目标的难点,在于实现模拟所需要的信息往往广泛分散在各类医疗记录、可穿戴设备、移动应用以及无处不在的传感器当中。
医学领域的数字孪生方案可以使用自然语言处理(NLP)、API及图数据库等原始数字成分实现数据理解,同时消除噪音以归纳当前客观模式。更重要的是,研究人员还可以对这些原始材料进行重组以建立起医疗机构、药物乃至医疗设备的数字孪生副本,借此改善医疗效果并降低运营成本。目前,其他行业也已经在建筑、产品开发及供应链管理中通过类似的方式建立起新的纯数字化工作流程。
“活的”数据系统
医学数字孪生的一大发展承诺,就是不仅能在生病时帮助我们摸清问题、治疗病症,甚至有望减缓我们的衰弱速度。专门投资数字医学初创企业的OMX Ventures公司董事总经理Dan Fero在采访中表示,“数字孪生代表着一套「活的」数据系统,它能够随时间推移持续接收纵向生物数据,跟踪并不断从变化着的数据集中学习,借此反映人体的当前健康状况乃至持续健康轨迹。”
这项工作的第一步就是测量并跟踪生物数据,例如胆固醇水平、维生素含量与医学成像结果。此外,系统还需要引入更复杂的其他数据点,例如基因组、表观遗传、代谢组学以及免疫功能等数据。
Fero解释道,“目前,我们在面对这些相互孤立的数据集时已经能够做出「一定程度」的推断,但还没有能力把这些数据集真正联系起来、再借助这种联系展望人体未来可能发生的健康水平变化。”在他看来,下阶段的发展目标就是开展数据编码以大规模创建数字孪生。现在已经有Q Bio等几家公司投入到这项意义重大的工作中来。
Fero还强调,“我认为这将是个极具吸引力的领域。此领域将在接下来的几十年中不断发展,而这一切的基础就是我们不断探索如何获取新的生物数据点、筛选这些数据点以把握可能影响健康变化的重要及预后指标,将海量数据集关联起来以解释整个生命体系的运作方式,最终找到一条准确可靠的纵向跟踪、甚至能够扭转病患长期健康状态的道路。”
很明显,当前构建数字孪生的要素还不够完备,但我们已经看到了一些可喜的希望。下面,我们就一同了解这十大基本要素在医学数字孪生领域各自发挥的作用:
电子健康记录
第一大要素就是记录系统,即医疗保健行业的电子健康记录(EHR)。电子健康记录系统负责收集诊疗交互、用药跟踪、治疗计划与实际效果等信息。目前全球领先的电子健康记录厂商包括Cerner Corporation、Epic Systems以及Meditech等。
这些系统能够为医疗组织提供静态信息基准。但要想更进一步、超越现有医疗保健流程与跨供应商扩展,还有很多现实挑战需要克服。犹他大学的一项研究发现,2018年内有33%的诊疗计划无法及时发现有风险、甚至致命性的药物配伍错误。虽然这一结果已经2011年的46%有了很大改善,但与理想状态仍有不小的距离。
但目前的电子健康记录方案普遍提供对药物组合的安全检测功能,所以研究人员们推测导致药物配伍不能被及时发现的原因,很可能是各家医院根据自身工作流程进行系统定制时干扰到了这些检测功能。最终得出的结论就是需要投入更多精力以提高数据质量,并将发现集成到各家厂商的系统当中。
Health Data Analytics Institute(健康数据分析研究院)CEO Nassib Chamoun在采访中提到,“医生必须在有限的时间内利用残缺不全的信息做出几十项关于诊断和治疗的重要决定。遗憾的是,现有电子健康记录中的数据无论是数量还是质量还远远跟不上实际需求。”
本体
为了在不同组织、不同环境下准确描述事物并保证可理解性,语言也就应运而生。所谓本体,就是借由标准化的数据含义及其与其他概念间的联系,帮助人们在混乱当中建立起秩序。作为典型的跨学科领域,医疗行业也孕育出了丰富的本体。目前美国国家生物医学本体中心已经列出953项医学本体,具体包含1300万个种类。
Semantic Arts公司(一家专门为业务系统提供本体专业知识服务的商业咨询企业)总裁、《Data-Centric Revolution》一书作者Dave McComb表示,“医学非常复杂,无法被整合进单一的数据模型当中。”
目前已经有努力在对这些浩如烟海的不同本体加以联合,其中包括雄心勃勃、定位为全球最详尽医学本体的SNOMED-CT项目。但McComb也承认,这些努力还没有完全解决程序员如何编码这些数据结构的问题,例如如何在命名、验证、安全性、完整性及应用代码等层面准确表达含义。但只要迈过这道难关,数字孪生就有望依靠智能API网关、NLP与现实世界证据平台等工具连通各个数据孤岛。
图数据库
图数据库特别适合把涉及不同概念(例如症状与疾病)的异构数据同医疗记录、测试结果与诊断记录整合至统一的系统当中。从实践层面来看,相当一部分数字孪生用例也都要求把不同类型、不同来源的数据纺织起来以探索其中的模式,所以图数据库自然可以为此贡献力量。
Neo4J图数据科学总监Alicia Frame在采访中表示,“我们发现已经有很多制药和保险企业利用图数据库技术从电子健康记录中获得大量有价值信息——包括将电子健康数据导入图数据库以摸清因果关系,或者快速发现异常的行为模式等。”以制药界巨头阿斯利康为例,他们就使用电子健康记录数据与图数据库跟踪上市新药、改善患者治疗效果。
某大型保险公司就利用TigerGraph图数据库整合了200多个数据源,借此提高了呼叫中心服务过程中查询患者病历记录的效率。以此为基础,客服人员能够快速调出全部诊断、索赔、处主补充及咨询通话等信息,将呼叫中心的单位处理时长缩短了十分之一、也成功提高了反映客户满意度的净推荐值。
但Frame也发现,在Epic、Cerner等医院当中,图数据库还较少被作为电子健康记录的配套数据库。她感叹道,“我个人认为这种滞后源自陈旧技术的遗留影响,也反映出存储健康记录数据与理解记录数据间仍然存在鸿沟——相信在逐步推广之后,图数据库能够帮助院方打通这些孤岛。”
展望未来,TigerGraph医疗保健行业实践负责人Andrew Anderson认为图数据库必将在构建社群数字孪生、衡量并改善人口健康方面发挥更大的作用。他表示,“只有将医疗信息与社会层面的决定性健康影响因素进行对比,才能把握并解决护理服务供应、食品安全问题、人口统计与财务差异等难题。”
API
无论建模对象是患者个人还是医疗机构,数字孪生都需要使用大量原始数据素材,具体涵盖电子健康记录(EHR)、疾病登记、可穿戴设备等。Change Healthcare的Cautam Shah在采访中指出,“无论配合哪种模型,API都有助于提升数字孪生效率、扩展使用范围,进而改善医疗保健的成本与质量曲线。”
Shah还提到,“但多数情况下,医疗数据的来源与格式都太过分散。”这时候就需要API协助解决跨来源数据命名、组织与管理等层面的具体问题。再有,API还能减少数据的收集、关联与准备时间,确保研究人员能够专注于发掘数字孪生中的实际价值。
现代API平台已经超越传统数据传输管道,逐步发展成智能连接体系。例如,API能够帮助我们构建起精准医学中的数字孪生副本,及时捕捉反馈与数据并将结果传递回孪生副本,从而不断更新数字孪生模型。
自然语言处理
医疗数据的来源多种多样,繁杂的信息往往令我们无法准确把握患者的整体情况。而一旦将目标投向大规模人群,复杂度又将呈现指数级增长。John Snow Labs首席技术官David Talby表示,“数字孪生有助于消除信息过载,改善整体护理成效。今天,人类生成的数据比以往任何时候都多,根本不可能再额外花时间对数据进行整理。”所以当病人接受初级保健医生的诊疗时,患者的个人情况、病史和用药史就会被记录在案。如果病情未能好转、转由专科医生接诊时,这些信息就能避免患者重复回答同样的问题。
另外,临床NLP软件还能从图像与无格式文本数据中提取信息,再将内容填写到电子健康记录当中。例如,Roche就使用NLP技术建立起临床决策支持方案,而且起步就指向肿瘤学领域。NLP能够从病理学和放射学报告中提取临床事实,再把这些事实与非结构化的无格式文本信息结合起来,更好地支持医生的临床决策。
结构化数据往往包含大量细节,例如患者是否患有慢性病、是否服用过治疗药物或者有过医疗保险。但真正影响诊治状态的却往往是其他更复杂的因素,例如疼痛程度、食欲和睡眠状态等,这些只能从无格式文本中找寻。NLP的介入无疑给找寻开辟了通路。
生物模拟
生物模拟属于计算机辅助数学模拟的范畴,能够模拟服用一定剂量的药物之后、人体会发生哪些变化。这是一种规模庞大的复杂模型,能够模拟药物在体内的运输、代谢、排泄与起效机制,改善用药安全与效果。所以这样的模型越强,价值2000亿美元的全球药物研发行业就能获得更大的发展驱动力。Certara公司CEO William Feehery博士在采访中提到,“过去几十年以来,生物模拟软件平台已经给药物研发带来过重大变革,预计这一趋势将继续保持下去。”
美国食品药监局(FDA)与欧洲药品管理局(EMA)先后发布过二十多份建模与模拟相关指导文件,希望摸清药物配伍时的相互作用。过去十年以来,包含生物模拟内容的科学出版物数量也增加了两倍。
目前最具前景的方向之一就是药理生物模拟,即整合药物与生理信息以建立数学建模框架。这类模型能够预测各类未经测试的临床结果,从而助力药物研发。Certara等公司希望为患者个体建立数字孪生,从而把生物模拟的边界继续向外拓展。其中的基本原理就是重现每位患者的不同生理特征,探索这些特征如何影响药物在体内的代谢动力表现、进而影响最终治疗效果。
这些进展也让我们能够更好地针对不同患者亚群(例如老人与儿童)设定用药剂量。Feehery表示,“我们的下阶段目标,就是将虚拟孪生技术引入病患护理与临床决策,为个性化医疗提供指导。”
真实世界证据
研究人员往往需要通过多种来源查询数据,借此深入理解特定问题。而真实世界证据(RWE)平台的定位就是汇总并审查原始数据,确保这些正确的数据可以反映出关键决策中的因果关系。2020年美国食品药监局批准的所有新药中,约有75%涉及某种形式的真实世界证据。这类数据可以来自电子健康记录、保险索赔、产品与疾病登记、医疗设备与可穿戴设备等等。由于数据来源过多、彼此间又有着诸多互操作性限制,所以如何收集完整且高质量的数据一直是个重大难题。
Aetion公司高级副总裁兼副本分析总经理Khaled El Emam博士认为,“这些平台能够帮助客户推断出研究人员在源数据中发现因果关系的依据,由此提升合成数据或数字孪生的价值。如果没有真实世界证据平台提供适当的上下文支持,研究人员将很难从数字孪生中分析出直观可见的模式。”
除了医疗保健之外,真实世界证据平台在保障建筑物、车辆及其他产品安全等方面,也给高度强调安全性的行业带来了福音。El Emam指出,“保障质量与可行性标准是真实世界证据流程中的重要组成部分。我们也应该将这些标准引入整个真实世界证据的生成过程,确保从数据源、数据处理再到适用场景定义,各个环节都稳定可靠。”
手术智能
手术智能是Theator公司提出的一个新概念,强调通过工具捕捉手术过程中的各项数据。Theator公司CEO兼联合创始人Tamir Wolf博士解释道,“其中的创新不仅体现在我们建立的数据结构与新本体上,更在于外科医生在手术完成后能够立即收到准确反馈。”
手术智能其实与Drishti、Tulip Interfaces等制造与物流企业已经实施的物理流程捕捉工具类似。在医学领域,这些工具将帮助外科医生在手术过程中进行操作校正,同时捕捉手术操作中的每一个微小细节。
Wolf表示,“医院系统要想有效部署数字孪生,最关键的前提之一就是要能够收集关于治疗需求的高质量数据,这样才能将目标与实效联系起来、总结出值得推广的最佳实践。”
预测分析
数字孪生还有另一个极具前景的探索方向,就是帮助我们预测特定症状组合发生几率,而后评估各种治疗组合帮助患者恢复健康的可能性。预测分析工具可以与数字孪生技术协同,将患者的数字孪生与其他具有相似特征的以往病患进行匹配和比对。
Health Data Analytics Institute CEO Nassib Chamoun认为,“先进的统计技术有望帮助我们预估健康风险,帮助临床医生推断哪些既有治疗手段对这类患者更加有效,之后做出更明智的诊疗决策。”简而言之,预测分析工具可以帮助预测不同治疗方案的成本和临床结果。
预测分析还能与数字孪生携手提供不同的UI体验,随时交付各类洞见结论。例如,HDAI就为临床医生、患者和人口健康管理员开发出自定义视图。临床医生的意见可以直接嵌入至电子健康记录,管理员与患者自己的意见也可嵌入各类应用端。
可视化
医学影像的显影效果再逼真,摸不清其中表达的规律和趋势还是没有意义。例如,更深入的洞见结论能帮助医生们更好地使用医学影像,据此确定该选择多大的植入物、具体植入到哪里。FEops公司CEO Matthieu De Beule表示,“说起来容易,但实际判断其实非常困难。我们很难单凭想象来断定医疗设备会怎样与患者的身体进行交互。”
经过监管认证的器官医学数字孪生能够改善手术计划与指导思路。例如,FEops公司开发出一种获得审批的心脏模拟工具,能够缩短手术操作与辐射下的暴露时间。多家主要心脏瓣膜制造商也打算利用这款工具开发下一代植入方案。
De Beule还提到,他们公司正在与GE、飞利浦和西门子等大型医学成像公司合作。FEops HEARTguide产品使用AI技术对原始成像数据进行校准,确保其能够反映患者独特的解剖特征与生理构造,从而指导医生在手术过程中为植入物选择更恰当的位置。