对于AI,有的人幻想,有的人偏见。
AI作为工具,计算方法,可以有效学习现实世界的内在规律,并快速推理获得结果,兼顾精度和性能,对当今科学计算领域的研究范式已经产生了影响,逐渐形成了AI for Science这个新兴研究领域,并正在改变科学探索的范式。 那么,AI能否帮到数学家?
也许这样提问会更好:“AI能否辅助数学探索?
物理是科学的基础,数学是物理的基础。物理学里面各种各样方程,其中相当一部分是微分方程。
理论上,物质在宏观上的性质是可以被算出来的。假如能够求解所有微分方程,基本上就可以去模拟整个物理世界。
比如,解薛定谔方程。这个方程在100年前就有了,但求解这个方程很难。
传统方法搞不定高维非线性的复杂函数。
搞不定,不行。算得很慢,也不行。
正好,深度学习的神经网络可以来帮忙。它的优势在哪里?
神经网络能力在于探索出一个非常有效地逼近高维函数的解。
或者说,神经网络可以拟合高维复杂的函数,快速推断,去计算这个函数的值。
神经网络不仅可以快速推断(Fast Inference),而且推断精度“还好”。注意,这里的“精度还好”,不是“精度准确”。
或者说,神经网络恰好是精度“刚刚好(Above Right Accuracy)”,足够解决要解决的问题。这是神经网络成功的一个核心。
很多时候,没有必要算到非常高的精度。有时候识别一张图片,是猫,还是狗。在图片里面加上一大把噪声,或者把一半的像素丢掉,还是能识别出是猫,或者是狗。 所以,精度是要基于任务的,而不是把“精度”单独拎出来谈。
总结一下AI这三个“战斗力”,也是AI在科学应用里面能如此有影响的关键三点。
第一,逼近高维函数。
第二,做快速推断(Fast Inference)。
第三,精度刚刚好够(Above Right Accuracy),或者说精度“够了就行了”。
那么AI for Science发展中,AI最合适的定位是什么?
答案是辅助创新。
AI辅助数学探索是个好方向。
用AI这个工具,分析数据,提炼潜在规律,但这里面有可能大量是“谬误(spurious)”规律。
这时候,人类“介入”,人类从中筛选出真正有意义的规律,从而来推动科学的发展。
你看,人工智能用来预测蛋白质三维结构的Alphafold2模型经常也会推断出一些令人困惑的结构,又或者推断出一些不准确结果。
但是,它推断得快,可以给科学家很多选项。最后,再由科学家拿主意。
再举一个,神经网络寻找抗生素的例子。
世界卫生组织(WHO)有个“通缉令”,通缉名单上都是最危险的病原体。 2019年,《细胞》杂志封面报道:
人类首次用AI发现“新抗生素”,从超过一亿多种分子中识别出了强大的新型抗生素分子,并且在小老鼠身上做了验证,发现确实是有效。
既然如此,何不就利用AI可以快速从海量数据中去提炼出一些有可能潜在的规律的这个特长,再由人来进行筛选。
谷歌子公司DeepMind帮助数学家猜测函数关系,辅助证明定理这个例子,是典型的AI for Science。
对此,北京大学北京国际数学研究中心董彬教授告诉“亲爱的数据”:
数学家的紧密参与和与机器学习积极互动尤为重要,机器学习仅仅提供底层支撑,这种工作模式未来能够产生的影响有可能是巨大的。
数学家还要注意哪三个点?
1. 可能只有一小部分问题可以用这种方式解决。
2. 数学家和机器学习(数据采集、建模、归因)之间的密切互动至关重要。
3. 数学家和机器学习之间的分工可能严重依赖于手头的数学问题和数学家本人。
为什么说是“机器学习辅助探索”,而不是“机器学习探索”?
因为机器学习只能提供辅助,包括辅助数学家去提出猜想。
回顾应用数学的发展,从第二次世界大战,尤其是从曼哈顿计划开始,那个时候的应用数学,或者说科学计算基于模型的(或者说解方程)。
从2010年往前数三十年,出现了基于数据的应用数学,有代表性的就是小波,压缩感知,图像处理。
国际数学联合会(International Math Union,IMU)有一个高斯奖,国际数学界为应用数学设立的一个极高荣誉,从创立到目前一共颁奖四次,其中有三次都是基于数据的应用数学。
这三位高斯奖获得者分别是:2010年,数学家伊夫·迈耶(Yves Meyer),他是小波理论的先驱之一。2014年,数学家斯坦利·奥舍(Stanley Osher)。2018年,数学家大卫·多诺霍(David Dohono),他是压缩感知奠基人。
应用数学发展的未来,是新范式的未来,即数据+模型的范式,不是纯数据驱动,或者纯模型驱动的范式。
AI for Science最核心的一点就是利用深度学习这个工具,通过分析数据,使得AI辅助科学家进行科学探索的新范式,为科学带来了模型与数据双驱动的新的研究范式。
即便是人工智能,不合理运用机理,不把领域知识嵌入人工智能算法的设计,是很难有生命力的。