【51CTO.com原创稿件】 庚子年初,新型冠状病毒来袭,打乱了人们的工作和生活。除了“逆势前行”的医务工作者以外,还有更多的科研机构人员对病毒进行分析,筛选潜在药物和研发疫苗。上海交通大学陈海峰课题组便是其中的一员。
在新型冠状病毒疫情爆发时,陈教授课题组积极开展研究的准备工作,在对新型冠状病毒潜在药物筛选工作时,利用AWS的CPU实例快速搭建虚拟药物筛选流程,通过GPU实例搭建分子动力学模拟分析流程,从而找到有效的药物分子的成药可能性。
药物发现涉及多个阶段 并非易事
陈海峰课题组是隶属于上海交通大学生命科学技术学院生物信息学与生物统计学系和微生物代谢国家重点实验室的研究团队,其团队主要研究方向为虚拟药物筛选,分为两大方向,一是天然无规蛋白的精准分子力场研究,二是通过计算机辅助创新药物设计,找到药物和靶标蛋白之间的匹配关系,从而找到治疗某种特定疾病的相关药物。
上海交通大学陈海峰课题组
新型冠状病毒出现后,很多医疗机构和科研机构都在积极的找到应对病毒的药物,然而,新型病毒出现后,是需要多个阶段才能完成最终的药物发现,这并非易事。陈海峰教授介绍道:一个新的病毒出来后,首先我们将病毒株分离;分离后对病毒进行基因测序;测序完成后,对病毒基因组的序列进行分析,找到重要的能够编码蛋白的基因,也就是关键性蛋白;下一步,通过X射线衍射或者冷冻电镜的方法,测定病毒蛋白的三维结构,作为药物筛选的靶标;而后,可以利用计算生物学的方法评估哪些小分子化合物能够和已知蛋白靶标很好的结合;有了虚拟筛选结果后,通过特定方法,例如细胞实验,验证其是否能够抑制病毒;接下来就是临床试验,通过动物模型,验证药物有效性;然后是人体的三期临床试验,评估药物的安全性、治病效果以及大批量试验确定药物的剂型剂量。
陈海峰教授表示,天然无规蛋白是一类在生理条件下没有稳定三级结构的蛋白质,这类蛋白在真核生物蛋白质组中的含量超过40%,与肿瘤、心血管疾病、神经退行性疾病以及糖尿病等复杂疾病的发生发展密切相关。由于它们很难结晶,现有试验方法很难测定它们的结构。于是计算机生物学的方法就成为研究这类蛋白的一种重要方法。为了研究这类蛋白,我们就开发了相关分子力场,即在ff03分子力场的基础上,通过添加基于格点的能量矫正项,发展了一种平衡而高效的分子力场ff03CMAP,该力场受到国际国内同行的广泛关注。
如何短期获取高效研究成果 云成为可能
在新型冠状肺炎疫情期间,陈海峰课题组也进行了相关研究,通过计算机辅助筛选哪些药物分子可能与新型冠状病毒的关键蛋白结合,让病毒的生命周期终止,从而抑制病毒蔓延。
要想筛选药物分子,需要知道病毒的关键蛋白。在饶子和院士课题组发布了新型冠状病毒蛋白的晶体结构后陈海峰课题组在第一时间(1月27日)申请进行抗病毒药物的虚拟筛选研究。
但是,人类对新型冠状病毒的了解还非常有限,需要进行大量的计算研究,而且时间不等人,越是快速研究出成果,越可以早日打赢这场攻坚战。陈海峰教授表示,新型冠状病毒在全世界大流行,越早获得相关信息,找到可能的命中结果,就可以越早的结束这场疫情。
但是药物的筛选过程非常复杂,需要大量的计算资源来辅助完成。陈海峰教授告诉51CTO,传统的方法是用过本地服务器来进行研究,而且,通常需要很长时间才会有结果。此外,由于课题经费有限,计算资源不能无限扩展,要想在短时间获得更高效的结果,云计算提供了一种可能性。
陈海峰教授
在全球疫情爆发之时,亚马逊在全球推出了“AWS诊断开发计划”,是AWS针对新型冠状疫情成立的专项研究基金,为研究机构和商业药物研究组织提供包括云计算资源和技术方面的支持。当得知AWS诊断开发计划后,陈海峰教授课题组欣然加入,双方一拍即合。
CPU+GPU 加速药物筛选进程
据陈海峰教授的学生刘灏介绍,过去,课题组在本地有两台服务器,装有8张GPU运算卡。但是随着时间更迭以及技术的快速发展,实验室的NVIDIA Tesla K20 或K10的GPU运算卡计算效率以及性能都相对降低。于是,课题组采用了AWS中国(宁夏)区域的计算资源展开研究。
课题组通过采用 Amazon EC2实例(c5.9xlarge,第5代计算优化型实例),完成药物的虚拟筛选工作。在得到新型冠状病毒的S蛋白结构后,课题组通过分子对接的方法筛选亲和力(药物分子与蛋白的相互作用),评估有可能的药物小分子。通过AWS的计算实例,仅用2天时间就完成了五个药物分子库的筛选,获得了14个具有潜在抗毒性的分子。
在药物小分子筛选完成后,需要通过GPU平台进行分子动力学模拟,来验证药物与病毒蛋白之间的作用,这就利用了Amazon EC2实例(p3.8xlarge,第三代GPU实例,内含8个GPU,支持NVlink)。课题组搭建了GPU加速的分子动力学模拟分析流程,选择了虚拟筛选结果最优的4个药物分子进行第一批的模拟分析,仅用1周的时间(本地服务器一般需要20-30天)就拿到了初步模拟的结果,随后又提交了第二批筛选药物分子进行模拟,得到了很好的分子模拟结果,证明了这些药物分子的成药可能性。
来自巴基斯坦的留学生Ashfaq Ur Rehman分享了课题组使用AWS的体会。首先,AWS的速度确实比本地的服务器快很多,在虚拟药物筛选速度方面提升了5倍,在分子动力学模拟过程中的速度平均提升4倍。第二,AWS平台是易用的。过去在研究时,我们需要连接本地服务器,效率较低,而且现在的环境也不能回到实验室。AWS提供的平台可以方便地连接到云端进行快速分析,登陆云端服务器后的操作使用与本地环境没有太大区别,帮助我们提高了筛选效率。第三,AWS是非常安全的。过去本地服务器是有多个课题组共用的,数据安全得不到有效保障,而AWS拥有隔离的网络环境,让我们安心地进行科研研究。
未来
目前,我国的新型冠状病毒疫情得到有效控制,但是对抗病毒之路还需砥砺前行。陈海峰课题组也会继续深耕,筛选研究出更多可以应对病毒的药物。陈海峰教授表示,未来会通过人工智能技术来设计更高效的分子力场,更加高效的评估药物分子或蛋白之间的相互作用,加快药物筛选进度;同时,会加大云端的资源和算力,更长时间评估药物分子与蛋白的结合情况,提高研发效率。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】