云计算正在成为生物医学界的“宠儿”。——8月14日,北京贝瑞和康生物技术有限公司与阿里云共同向外界宣布双方达成合作,共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。
此次,双方共同合作的“神州基因组数据云项目”将首先聚焦于基因组大数据在云平台上的批量计算、分析、存储,进而在基因大数据领域共同进行前沿探索。
“打造基因组大数据,相当于建立了一个中国人基因版的《本草纲目》,将记载中国人群最核心的基因信息、生命信息,为中国人群重大疾病的预测、预防、诊断和治疗奠定基础。它的意义将不亚于《本草纲目》这部东方医药巨典。”贝瑞和康***生物信息官于福利博士说。
中国是世界出生缺陷率***发地区之一。每年1600万至2000万的出生人口中,有80万至120万出生缺陷儿。1996年到2010年,中国新生儿出生缺陷发生率增幅达70.9%,每一万名新生儿中就有149.9人患有先天性缺陷。
这一不利的局面将随着“神州基因组数据云”项目的实现得到改观。据了解,贝瑞和康自主构建的中国人群基因组大数据库目前已包含超过四十万份基因组数据。通过对该数据资源的深入挖掘,能够进一步揭示中国人群遗传突变分布,这将极大助益于提升中国人遗传疾病诊断的效率和精准程度。
贝瑞和康作为国际领先的基因测序技术临床转化服务商,致力于为临床医学疾病筛查和诊断提供“无创式”整体解决方案,是无创DNA产前检测和针对肿瘤循环DNA的肿瘤个体化医疗基因检测的行业***。
基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种罕见疾病的可能性,如地中海贫血病。
业内人士指出,随着下一代基因测序、生物质谱和医学成像等医学技术的迅猛发展,大数据浪潮为生物医学带来了***的机遇,将根本性的改变生物医学基础研究和医疗实践,但同时生物医学领域数据爆炸式的增长也对海量数据的存储和分析提出新的挑战。云计算将大量计算资源、存储资源和软件资源虚拟化,形成规模庞大的共享资源池,可以有效解决生物医学对IT资源的弹性需求。
目前,新一代基因测序技术要得到比较准确的信息,一般认为 30X 的基因测序深度是必须的,所以一个人的基因组检测大约需要产生 90Gb 的数据。如此大的数据,在一般的电脑或小型服务器上运行起来非常困难。
阿里云是全球领先的云计算服务平台。客户通过阿里云,用互联网的方式即可远程获取海量计算、存储资源和大数据处理能力。根据IDC调研报告,阿里云是国内***的公共云计算服务提供商。
此次,阿里云与贝瑞和康达成合作,正是基于阿里云批量计算服务的强大能力,利用云计算的优势降低成本,提高数据分析的速度。
阿里云批量计算服务是一种适用于大规模并行批处理作业的分布式云服务,适用于生物基因分析、渲染、多媒体转码、科学计算、金融保险分析等多个行业领域。
阿里云高级专家林河山介绍说,“借助批量计算服务,用户可以调动海量计算资源快速完成基因大数据的处理。批量计算服务提供简单易用的API,允许用户通过有向无环图的方式灵活组建工作流,计算资源管理、作业调度和数据分发由系统自动完成。同时,批量计算服务支持自定义镜像,并允许应用通过网络文件系统(NFS)协议高效访问阿里云对象存储(OSS)上的数据,使得用户原有分析流程可以轻松上云。结合阿里云对象存储,批量计算服务能够帮助生物信息分析专家在云上快速构建大规模基因组学应用。”
他进一步说,“此次与贝瑞和康的合作,阿里云将不断优化基于基因组学的云解决方案,以契合医学时代发展的需求。”
业内专家预计,双方合作完成的基因组数据云将对中国临床医学的精准诊断,预防和治疗的发展产生深远的推动力。
无疑,借助阿里云的批量计算服务,用户将更便捷、更简单、更迅速完成基因大数据计算,大大降低客户的成本。同样,因为云计算的赋能,为研究人员开展大规模的基因组学研究大开“方便之门”,将催生一批影响人类健康相关的变革性成果。