“十四五”期间,《“十四五”生物经济发展规划》提出推动生物技术和信息技术融合创新。随着时间的发展,生物信息技术在生物研究和医疗创新中发挥着越来越重要的作用。但同时产业发展也面临着数据不仅庞大,而且高度敏感等问题。
为了更好的推动产业发展,解决上述困难,光合组织推出“光合基金”计划,联合华中农业大学、中科苏州智能计算技术研究院、北京理工大学、上海超寻科技有限公司等单位,基于基于国产加速卡软件移植适配和已移植软件测试,促进国产加速卡在生物信息领域构建全新生态。
其中,与华中农业大学开发的“PyXpol软件在国产加速卡平台异构计算方法”,有效完善国产加速卡平台的软件生态,实现在生命、材料和药物等领域有广泛应用。在光合组织的加持下,该方案采用MPI并行及并行和CPU/国产加速卡异步并行的方案,实现了百万原子的量子力学力场高效并行计算,同时,强可扩展性测试并行效率可达(80/8) 0.98,为生物信息领域在国家加速卡平台上的部署提供了可行性方案。
为大幅加速生物信息学中非常常见的蛋白质序列比对和查找计算任务,光合组织与中科苏州智能计算技术研究院共同研发“基于CPU-GPU异构计算的蛋白序列搜索软件Chorus”。在移植到国产加速卡后,程序保持了正确性,并且成功实现了多节点多卡的大规模计算。目前,Chorus成果已经在生物信息学顶级期刊 Bioinformatics 上发表。
同时,光合组织与北京理工大学共同研究“基于国产加速器的大规模冷冻电镜图像原位重构算法”。其基于国产加速卡的冷冻电镜图像原位重构软件DisSPA在国产加速卡移植成功,正确性验证通过,实现900:1的高加速比及强扩展性。目前,DisSPA已经在中科院生物物理所,首都师范大学,山东大学三家示范应用单位得到应用。
除此之外,光合组织还与上海超寻科技有限公司共同研究“NetGO-LS: 基于国产加速器的大规模蛋白质功能预测工具”。移植适配成功后,NetGO的国产加速卡加速版本在所有的数据集上都与原始版本的输出结果基本一致,通过了正确性验证。目前,已经有3个单位示范应用(百奥创思(上海)生物技术应用有限公司、长沙艾碧维生物科技有限公司、湖南大地同年生物科技有限公司),未来将广泛应用于蛋白质功能预测领域。
总体上来看,国产加速卡移植并适配,无疑是中国科技创新的一个重要里程碑,为行业发展树立“航线”。而这,也只是开始,未来,光合组织将不断创新、不断进步,为国产加速卡在科学计算、人工智能等领域发展贡献更多力量。