近日,《NPJ—计算材料》杂志上刊发了一项研究论文。
该论文由美国桑迪亚国家实验室一个实验小组撰写,记录了他们开发的一种机器学习算法。
这种算法能够以比正常速度快近4万倍的速度为材料科学家进行模拟计算,相当于人们可以在播种三分钟后吃下一个新鲜的西红柿,或者在半秒钟内从纽约飞到洛杉矶。
近几年,人工智能助力材料学发展的研究比比皆是。
1月8日,牛津大学教授Volker L. Deringer团队开发了一种基于第一性原理计算数据集的原子尺度精确机器学习方法。
使用更普适的、基于机器学习模型的、具有第一性原理计算精度的高斯近似势能(Gaussian Approximation Potentials,简称GAP)分子动力学模拟(GAP-MD),研究者对包含10万个硅原子(十纳米尺度)系统的液体—非晶态和非晶态—非晶态转变过程进行了研究,同时预测了其结构、稳定性和电子性质。
该方法成功地描述和解释了与实验观察一致的非晶硅的全部相变过程。
这项里程碑式的成果以封面文章的形式刊登在《自然》。
为什么是材料科学
中国科学院物理研究所特聘研究员刘淼更看重后一项研究成果。
他在接受《中国科学报》采访时介绍道,GAP方法自10年前诞生后,不断提升。
“GAP是用量子力学的方式产生大量的数据,再用这些数据构建机器学习模型,从而提升计算的效率与精度,将计算难度简化,甚至完成之前无法完成的事情。”
刘淼解释说,“GAP从大量密度泛函理论数据出发,提取原子间相互作用的信息,将材料计算研究对象的空间尺度放大103~104倍,时间尺度扩展103倍,且精度接近密度泛函理论计算精度。”
在该项研究中,研究人员通过仿真揭示了更广泛范围内硅的液态和非晶态转变过程,为极富挑战性实验条件下的材料预测建模开辟了新途径。
此外,除了硅这一特定材料,原子尺度机器学习方法还具备引领新的科学发现的能力。
由于该方法能够获得有关原子稳定结构、原子间相互作用等物性的精确预测,精度接近量子力学方法模拟,可被用于揭示迄今未知的诸多现象,探索介观系统、液态系统、非晶多晶、生物等复杂体系的动力学演化过程。
而前文提到的美国桑迪亚国家实验室的研究则建立在一个拥有128个处理核的高性能计算集群上。
研究人员在该计算集群上进行了一次单独的、无辅助的模拟。
机器学习的情况下,同样的模拟在使用36个核的情况下花费了60毫秒——相当于在同等的计算机上快了42000倍。
这意味着研究人员现在可以在15分钟内完成通常需要一年时间的计算过程。
而且,一直以来,机器学习被用于快速模拟,计算原子和分子之间的相互作用如何随时间变化。
但此次桑迪亚国家实验室公布的结果首次展示了机器学习在相对较大的微观尺度上加速材料模拟。
通过这种模拟,科学家可以快速模拟熔化金属的微小液滴在冷却和凝固时是如何聚集在一起的,或者当混合物熔化时是如何分解成的。
不仅如此,新算法得出的答案正确率也十分高,与标准模拟的结果相差5%。
“我们的机器学习框架达到了与高保真模型基本相同的精度,但计算成本很低。”参与该项目的桑迪亚材料科学家雷米·丁格维尔表示。
中国科学院深圳先进技术研究院研究员欧勇盛在解释这项研究时谈道,这是应用计算机仿真加快计算过程的尝试,而实现这一目标的原因是材料学本身更注重实验,换言之,实验过程的数据计算是人工智能所擅长的领域。
“因此,材料学与人工智能之间擦出了火花。”
两者相互影响
其实与材料学一样注重实验的学科很多,因此人工智能与其他学科结合的交叉学科也很多。
“近期人工智能飞速发展的动能在于算力进步,算力进步使生产、处理海量数据成为可能,进而使人工智能渗透进了各行各业。”
刘淼说,“刚好材料科学进入了数据积累快速发展期,高通量实验和计算等一些新技术正在为材料科学领域生产大量数据,人工智能使大数据分析处理成为可能。”
“通过实验,研究人员可以总结和归纳其中的规律,计算机算法就是计算机实验的过程,之后计算机才能够总结并归纳其中的规律,然后完成某项工作。例如,计算机写诗。”欧勇盛介绍道。
2019年2月,美国国家科学院发布了针对材料研究的第三次十年调查——《材料研究前沿:十年调查》,评估了过去十年中材料研究领域的进展,确定了未来十年材料研究的机遇、挑战和新方向。
其中,在纳米材料、高熵合金等前沿材料研究领域,人工智能被寄予厚望。
机器学习方法在材料设计和材料筛选方面表现出巨大潜力,有望极大推动新型材料的发现和传统材料的更新。
反过来,人工智能的发展也离不开材料科学的助力,智能机器人、可穿戴医疗设备、虚拟现实(VR)成像、物联网城市系统……未来的智能传感器需要极高的灵敏度、柔韧度、透明度和稳定性,这对材料提出了新的要求。
“人工智能与材料科学,两者应加深交流,相互促进。”
中国科学院院士赵忠贤在2019年粤港澳大湾区科技创新论坛上提出,未来,解决人工智能使用的敏感元器件问题要靠材料科学,同时也有必要根据材料科学的需求去发展人工智能技术和理论。
先有数据再有算法
“人工智能是个雏形,可以推动很多领域进步,还需要专业人士去改造。”欧勇盛说,“现在,交叉学科是创新的原动力,人工智能作为一种工具,更需要与其他学科合作才能发挥其最大的作用。”
作为人工智能深度学习的基础,数据的质量和数量是这一学科的关键。
目前,不少国家拥有自己的材料学数据库。
“有了数据库,人工智能方法如深度学习等才能提取数据之间的关联和规律。”刘淼表示,“有些学科与人工智能交叉得少,就是因为数据量不够大。”
2018年,由刘淼等人联手正式开始创建我国材料科学数据库Atomly,该数据库已经在2020年8月上线。
“材料学数据库上线后,主要影响有两方面。”刘淼解释说。
首先,目前大多数研究都是基于经验指导,即研究人员会根据自己的经验做判断,通过实验合成表征对材料进行试错和验证,而当大数据和人工智能介入后,通过数据驱动的方式进行预测,让实验更加有的放矢。
其次,人类个体的认知能力有限,即便是积累毕生所学,依然会遇到瓶颈,计算机则可不断横向扩展,无上限可言。
“2016年AlphaGo打败了人类棋手,未来人工智能和材料科学数据库也有望不断进步,成为人类材料科研的好帮手。”刘淼说。