众所周知,大到宇宙天体运动、大气动力演化,小到细胞群、分子运动,复杂物理系统都满足着某种特定的规律。
作为精美的科学符号语言,数学方程可以用于准确描述这些复杂的现象,如开普勒行星运动定律、牛顿运动定律和纳维叶—斯托克斯方程(Navier-Stokes equations)等,它们都可以用一系列经典的微分方程来表达。
然而,在实际应用中,不少测量数据具有 “小样本、高维度、稀疏、噪声大” 等特征,这导致现有的提取偏微分方程的方法不再适用。
为此,中国人民大学高瓴人工智能学院长聘副教授孙浩带领其团队提出了一种新颖的“物理驱动深度学习+稀疏回归”(Physics-informed Neural Network with Sparse Regression,简称 PINN-SR)方法。该方法基于 “小样本稀疏噪声”测量数据,可准确提取出复杂系统的控制方程,这种控制方程又被称为时空偏微分方程简明解析式。
相关论文以《从稀缺数据中学习控制方程的物理学知识》(Physics-informed learning of governing equations from scarce data)为题发表在 Nature Communications ,第一作者为陈钊,美国东北大学机械与工业工程系助理教授、博导刘扬为共同通讯作者[1]。
图 | 相关论文(来源:Nature Communications)
在工程应用的研究中,科学家们通常依赖于完全已知的控制方程,对常规的物理系统进行建模与仿真。而推导系统状态控制方程的传统方法主要为利用守恒定律、现象观测与猜想,可能不适用一些复杂物理系统。
多元化的测量数据和深度学习的发展,为解决这一难题带来了新思路。研究者们从数据角度进行探索,可面向复杂物理系统构造出物理可诠释性的数据驱动模型,这有助于推进系统的建模与仿真,并加深人们对该类系统的认识。
当前,通用深度学习理论和技术存在一定的弊端,其虽然拥有强大的信息挖掘和表示能力,但主要依赖大量监督数据,这样得到的数据驱动模型并不具备明确的物理含义,且外推和泛化能力普遍较弱,在面临非理想化数据下的科学问题时往往力不从心。
图 | 孙浩(来源:孙浩)
孙浩表示,“现有提取偏微分方程的大多数方法基于稀疏回归,利用数值方法求导数,因此局限于理想化的小噪声或零噪声、非稀疏结构性的高质量测量数据。”
因此,该团队首先构建了一个深度神经网络,用来近似于偏微分方程,利用自动微分得到导数解析表达,形成候选代数项文库,进而用来表达未知的偏微分控制方程;通过深度神经网络和偏微分方程的相互约束,形成整体单一型网络结构(one-network architecture)。
图 | PINN-SR 框架的示意图架构(来源:Nature Communications)
由于训练参数具有异构属性,如深度神经网络参数是连续的、方程代数项系数是稀疏的等,会形成 NP-hard 优化问题,无法对网络参数进行统一训练。
对此,该团队提出一种交替方向优化(alternating direction optimization)的方法,将神经网络参数和方程代数项系数进行交替迭代优化,从而训练出具有外推能力的高质量神经网络,用来近似系统响应,进而提供精确的导数估值,确保稀疏回归识别方程系数的严格稀疏性。
图 | 刘扬(来源:刘扬)
孙浩称,对于一些未知的复杂非线性或混沌系统,用作描述其状态和响应的方程解析表达通常是未知的,如新材料的本构关系、宏观经济指标演化规律、在特殊培养环境下细胞群运动规律、环境指标的时空演化、极端天气下的大气动力系统等等。
而该团队提出的方法,在解决这些挑战性问题上,有很大的应用潜力, 一方面为进一步仿真、了解、控制此类系统提供理论基础,另一方面利用可诠释性 AI 技术推动了此类应用学科的新发展。
目前,该团队提出的方法已成功应用在各类物理及生物、化学系统,如流体、反应扩散系统、量子系统和细胞群体运动等。
审稿人认为,该方法是一项重要的成果,能够有效 解决 “从小样本、高维度、稀疏、高噪声测量数据中准确提取偏微分方程” 这一挑战性难题,并以实验充分证明了该方法具有较好的通用性,可用在各类复杂物理、化学、生物系统中。
目前,文章的第一作者陈钊在美国太平洋国家实验室做博士后。此前,他在美国东北大学取得博士学位,指导老师为孙浩教授。
图 | 陈钊(来源:陈钊)
陈钊表示,写这篇文章的过程中,在工作学习、生活娱乐等方面发生了许多有意思的事情,让人有 “work hard, play hard” 的感觉。在改进算法、提升结果的时候,该团队经常会集思广益,“唇枪舌战” 也不时发生过。而在课题构思、算法设计和论文写作等方面,团队的老师们都投入了巨大的精力,事无巨细给学生提供了很有针对性的指导,好像很多细节都在脑海中提前过了一遍一样。
此外,陈钊称,孙浩老师很善于文字表达和视觉设计,经过他修改过的段落或图片令人印象深刻,很值得学习。