本文作者为SolveBio创始人及斯坦福遗传学副博士,twitter账号@markkaganovich。科技搜集生物数据的开始以及计算的大规模盛行,两者的结合将会发起一场医疗革命。对疾病的理解与治疗需要对人体生物学及病变细胞有渊博的知识,直到今天,科学家要想获得数据建立正常细胞与病变细胞的模型都需要做实验,看报告,参加讨论会议。
但是,随着技术的突破,数据搜集变得可以扩展,医疗研究将会经历一次结构性的技术转变。大量的数据结合电脑意味着,研究员将能访问那些他们自己无法搜集或无法记住的数据,诊所以及实验室将会很快拥有大量数据,治疗速度将呈指数加快。
新技术改变研究在搜集治疗数据方面还存在巨大困难,许多观察性研究都因为无法搜集到足够有用的信息,导致取得的成功有限。若研究想发展更快,大学,医院及生物技术公司就必须搜集诊疗数据并将之与可以采用的结果整合。
在过去10年,生物技术的发展都在描述一幅关于“大生物”这个新领域如何变成现实的图,DNA测序规模化与正确性的飞速发展让我们对基因的理解有了极大进步,但这只是开始,定序技术还有很长的路要走。
试想如果有一天,研究员可以将数据整合并找到模式,而且由于技术越来越便宜,病人可以检测更多项目,比如每个组织的基因序列与基因表达,染色体状态,小分子及代谢物,土著微生物,病原体等,任何人在经过病人同意之后都能创建这个数据库:学校,医院,公司,所导致的数据龙卷风网络将是巨大的,将出现大量数据及巨大机会。那这些数据如何被整合,那就是云计算要解决的问题。
与云的关系 云的出现为数据整合提供了可能,云能为那些擅长某些类型数据搜集及整合的研究员,医生,企业家创造一个价值网络。这些数据的真实价值将在分析其它所有可用数据的环境中被挖掘,不论是在公共云或私人的,安全的环境中。
比如创业公司SolveBio就想利用云计算,让一些大规模分析应用技术与整合工具能被更好更简单的被运用,新医疗发现将会从中收益。
受益最大的应该就是癌症研究,从某种程度上说,如果你活得足够长,总会患癌症,因为癌症的病因是因为基因调节失控,癌症之所以复杂,是因为它的产生是不同细胞不同病变产生的。
癌症研究=大生物癌症将是最终的大生物问题,肿瘤有成千上万的突变与重组,比正常组织要多得多,而癌细胞在肿瘤中可能有不同的基因组,许多突变基因都是不携带信息的乘客,而一些细胞则是司机,产生无法控制的细胞增殖,导致癌症,为了区别“乘客”与“司机”,许多突变基因的复制案例及控制需要理解,
搜集每个病人的每个肿瘤的综合情况来建立一个可以研究正常细胞与癌变偏差的模型,对医生,治疗公司等制定治疗方案非常有用,试想一下,如果某天,每个肿瘤被全面描述,还有不同领域专业技术所需要的很多数据,还有质量控制,模型建立,解释等,癌症的治疗是否会容易很多?
每例癌症每个人会因为基因组、蛋白质组、代谢和小分子等功能而不同。现在的技术会花上16GB内存的桌面电脑两天时间处理基因描述数据,这才仅仅是基因描述,还不包括下游数据整合分析,找出信息的相关性。然而有了云,这个工作就容易多了,仅仅是一个分布式计算平台就能搞定。
我们将从数据整合中学到越来越多用于测量癌细胞的数据,云能以前所未有的数据整合规模帮助医生,研究院,工程师治疗癌症。