让 AI 发现物理规律已经不是什么新鲜事,前段我们报道过「给 GNN 一堆数据,它自己就能发现万有引力定律」的消息,但如果我们连变量都不给它呢?哥伦比亚大学的一项研究表明,AI 仅通过摄像机观察现象就能自己提取出变量,而且有些变量可能是人类还没有发现的。如果借助这种方式来发现新的变量,我们是不是可以发现新的物理规律?
E = mc² 是阐述能量与质量间相互关系的质能方程,其中 E 表示能量,m 代表质量,而 c 则表示光速(常数,c=299792458m/s,有时取 3.00×108 m/s)。质能方程由爱因斯坦提出,主要用来解释核变反应中的质量亏损和计算高能物理中粒子的能量,并促成了波动力学的诞生。
一百多年前,爱因斯坦在提出这个方程之前显然已经有了能量、质量和速度这些基本变量。如果没有这些变量,即使是爱因斯坦,也无法发现相对论。但令人惊讶的是,人工智能现在可以自动发现这些变量,而且有些变量还超出了人类已知的范围,这将大大加快科学发现的速度。
这是来自哥伦比亚大学的一项新研究,研究者试图让一种人工智能程序通过摄像机观察物理现象,然后尝试搜索能够完全描述观察现象的最小基本变量集。研究论文于 7 月 25 日发表在《Nature Computational Science》杂志上。
论文地址:https://www.nature.com/articles/s43588-022-00281-6
如下图所示,该研究让 AI 观察运动的混沌摇杆驱动系统的视频,从这些高维视频片段中识别和提取描述此类系统所需的最少状态变量。
科学家们首先向系统提供他们已经知道解决方案的物理现象的原始视频片段。例如,他们提供了一个摆动双摆的视频,已知该双摆具有 4 个「状态变量」——两个臂中每一个的角度和角速度。经过几个小时的分析,人工智能输出了答案:4.7。
「我们认为这个答案已经足够接近了,」论文作者之一、机械工程系创意机器实验室(Creative Machines Lab)主任 Hod Lipson 说。「特别是考虑到所有 AI 可以访问的都是原始视频片段,没有任何物理或几何知识。但我们想知道它用的变量具体有哪些,而不仅仅是一个数字。」
然后,研究人员继续可视化 AI 程序识别出的实际变量。提取变量本身很困难,因为程序无法以任何人类可以理解的直观方式描述它们。经过一番调查研究,程序选择的两个变量似乎与两个摆臂的角度大致对应,但另外两个仍然是个谜。
「我们尝试将另外两个变量与我们能想到的所有已知变量联系起来:角速度和线速度、动能和势能,以及已知量的各种组合,」论文一作、刚从哥伦比亚大学拿到博士学位的现杜克大学助理教授陈博源(Boyuan Chen)解释说。「但似乎没有一个已知变量能够完美匹配 AI 程序所识别出的那两个变量。」该团队相信 AI 已经找到了一组有效的由四个变量组成的变量集,因为它做出了很好的预测,「但我们还无法理解它所用到的数学语言,」他解释说。
在用已知解决方案验证了许多其他物理系统后,科学家们输入了他们不知道明确答案的系统的视频。其中一个视频展示了一个随风摇摆的气球。经过几个小时的分析,程序返回了 8 个变量。同样,有关熔岩灯的视频也产生了 8 个变量。当视频换成关于壁炉的视频时,程序返回了 24 个变量。
一个特别有趣的问题是:AI 程序为每个系统所找到的变量集是唯一的吗?或者说,在每次重启程序之后,它所找到的下一个变量集还和原来一样吗?
「我一直在想,如果我们能遇见一个特别聪明的外星物种,他们会不会也已经发现了我们所发现的一些物理规律?或者,他们是否会以一种不同的方式描述宇宙?」Lipson 说,「或许有些现象之所以看起来非常复杂,是因为我们一直试图用错误的变量集来描述它们。」
在实验中,AI 每次重启时所提取的变量数量是相同的,但每次的具体变量是不同的。所以说,在常规方式之外,我们确实还有其他方式可以描述宇宙,而我们现在选择的这种方式未必就是完美的。
研究人员表示,这种 AI 可以帮助科学家发现生物学、宇宙学等学科中复杂的现象,在这种现象的研究中,理论理解跟不上海量数据的步伐。「虽然我们在这项工作中使用了视频数据,但其实,任何类型的阵列数据源都可以使用——例如雷达阵列或 DNA 阵列,」论文合著者 Kuang Huang 解释说。
这项工作是 Lipson 和哥伦比亚大学傅氏基金会应用数学讲席教授杜强(Qiang Du)几十年来研究兴趣的一部分,他们致力于创造可以将数据提炼成科学规律的算法。过去的软件系统,如 Lipson 和 Michael Schmidt 的 Eureqa 软件,可以从实验数据中提取任意的物理定律,但前提是预先确定变量。但如果我们连变量都还不知道呢?
Lipson 认为,科学家们有时候误解或无法理解某种现象可能仅仅是因为他们没有一组很好的变量来描述这种现象。「几千年来,人们一直都有物体运动快慢的概念,但直到速度和加速度的概念被正式量化后,牛顿才发现了著名的牛顿第二定律:F=MA,」Lipson 说。这些变量是理论得以形成的前置条件。基于这一点,杜强想知道,「还有哪些定律是因为缺乏变量而没被我们发现呢?」
作者介绍
论文一作陈博源现任杜克大学助理教授,负责领导通用机器人实验室(General Robotics Lab)。他博士毕业于哥伦比亚大学计算机科学专业,主修计算机视觉、机器学习和机器人专业,师从世界机器人、数据科学、3D 打印先驱 Hod Lipson 教授。他曾在国际人工智能和机器人领域顶级会议(NeurIPS、IROS、GECCO、Humanoids 等)发表多篇论文,担任多个国际会议审稿人(CVPR、ICML、ICLR、PRCV 等)。此外,他还曾获 ACM GECCO 学生奖学金、中国政府奖学金、中国科学院空间科技创新奖学金等。