陶哲轩预测再成真!AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖

人工智能 新闻
最近的数学圈,都被椭圆曲线的murmuration(椋鸟群飞)现象震惊了。由经验不足的本科生无意中做出的这个成果,竟让一位华人数学家离「千禧年问题」更近了一步。而且这次数学难题的破解,是由AI来完成的!

用AI研究数学领域,最近又有重大发现了。

这次数学家们用AI发现的,是椭圆曲线中的murmuration(椋鸟群飞)现象。

他们发现,如果以正确的方式观察,在椭圆曲线中会出现像飞行中的椋鸟群一般的图案。

图片

现在,murmuration相关研究已经轰动了数学圈,每周都有相关新研究问世。

令人不可思议的是,这个发现是由数个偶然组成的——

椭圆曲线的数据,恰巧按照conductor来排序;一个经验不足的本科生,恰巧没有处理某个数值,让曲线的震荡极为明显;按照conductor预排序的数据集,恰巧被人提前做了出来……

任何一个要素的变动,都会导致人类与这一重要的数学发现失之交臂,或许再晚上几十年……

并且,被陶哲轩认证的说法再次被证实:数学家们要做好准备了,AI将在十年内,赶上甚至超过最优秀的人类数学家!

七大千禧年难题之一

椭圆曲线,一直是现代数学中最迷人的对象之一。

它看似简单,却是把高中数学连接向深奥的数学研究的一条快速通道。

它是1990年代Andrew Wiles证明费马大定理过程中的核心,还是现代密码学的关键工具。

在2000年,克莱数学研究所将椭圆曲线统计特性的一个猜想,列为七大「千禧年问题」之一,悬赏100万美元的奖金。

在1960年代,这一猜想被数学家Bryan Birch和Peter Swinnerton-Dyer提出,至今尚未得到证明。

因此,深入探索椭圆曲线,已经成为了数学领域的一项重要的高风险任务。

果然,有人想到了用AI向椭圆曲线难题发起了冲击。

在2022年,数学家利用统计技术和AI,竟然在椭圆曲线上发现了一些出乎意料的全新特性!

他们发现:如果以正确的方式观察,椭圆曲线就能「像椋鸟成群结队一样飞翔」。

任教于普林斯顿大学和高级研究院的数学家Peter Sarnak表示:「机器学习总会给我们带来一些意料之外的惊喜!」

椭圆曲线上为什么会出现这些特性呢?刚发现时,许多数学家感到非常困惑。

近期的一些研究发现,这些类似椋鸟群飞翔时不断变化的形状(murmuration),并不仅仅是2022年研究中的特例,而是椭圆曲线普遍的共性。

神奇的椭圆曲线

要弄明白这些模式究竟是什么,我们首先得对椭圆曲线及其分类有所了解。

椭圆曲线是通过一个变量(通常用y表示)的平方与另一个变量(通常用x表示)的三次方之间的关系来定义的:y^2=x^3+Ax+B,这里的A和B是满足几个简单条件的一对数值。

椭圆曲线方程定义了一条可以在平面上绘制的曲线,如下所示。

虽然看起来很普通,但对于数论学者来说,椭圆曲线却是非常强大的工具。

这是因为,数论学者需要在整数中寻找规律。他们不喜欢让变量x和y所有数字中取值,而是希望将它们限制在特定的数系中,也即在给定的数系上定义一个曲线。

而仅限于有理数的椭圆曲线,在数论的研究中格外有用。

普林斯顿数学家Sarnak说,「实数或复数域上的椭圆曲线非常单调,真正有深度的,是定义在有理数域上的椭圆曲线。」

下面这个例子,可以证明这一点。

如果我们在椭圆曲线上任意两个有理点之间画一条直线,那么这条线再次与曲线相交的位置,也会是有理点。

利用这个性质,我们可以在椭圆曲线上定义一种「加法」运算,如下图所示。

在点P和点Q之间画一条直线,这条直线将与曲线相交于第三点R。(如果这条直线不与曲线相交呢?数学家们就会巧妙地添加一个「无穷远处的点」。)

接下来,就是见证奇迹的时刻——R沿x轴的镜像点,就是P+Q的和!

结合这种加法运算,曲线的所有解,就形成了一种称为「群」的数学对象。

而数学家正是借助这种方式,来定义曲线的「秩」。

曲线的秩反映了它拥有的有理数解的数量:秩为0的曲线只有有限个解,而那些秩较高的曲线,则有无限个解。

而这些解之间的加法运算关系,就是用秩来描述的。

秩的概念不是那么容易理解。数学家并不总是有办法计算出秩的数值,也不能确定它的最大值能达到多大。(目前已知的某个特定曲线的最大精确秩是20。)

而外观相似的曲线,也可能拥有完全不同的秩。

此外,椭圆曲线还与质数(只能被1和自身整除的数)有着紧密的联系。

因此,数学家还特意研究了在有限域上的曲线。

有限域是一种围绕每个质数定义的循环算术系统。

我们可以把有限域想象成一个时钟,其「小时数」就等同于该质数:到达这个质数时如果你继续往后数,数字就会从0开始。

例如,在质数7构成的有限域中,5加2的结果是0,5加3的结果是1。

图片

每个椭圆曲线,都有一个称为a_p的数列,这个序列反映了由质数p定义的有限域内椭圆曲线的解的数量。

如果a_p的值较小,曲线的解就更多;反之,a_p的值较大,则解的数量更少。

尽管计算曲线的秩相当复杂,但是找出a_p序列却容易得多。

基于一台非常早期的计算机上计算出的成果,数学家Birch和Swinnerton-Dyer提出了一个猜想。

他们认为,椭圆曲线的秩与a_p序列之间存在特定的关系。

谁要是能证明他们的猜想是正确的,不仅能赢得一百万美元的奖金,还将在数学史上青史留名。

AI有了惊人发现

然后,我们就来到了这位华人研究员的故事。

在2020年,英国皇家学会伦敦数学科学研究所的研究员Yang-Hui He(何杨辉),决定借助AI来挑战椭圆曲线问题。

何教授本科学的是物理,然后在MIT取得了数学物理博士学位。

但随着时间的推移,他对数论的兴趣与日俱增,并且开始考虑用AI来探索数字中的未知规律。

此前,他就已经开始利用机器学习,对弦论中广泛使用的Calabi-Yau流形进行分类了。

论文地址:https://arxiv.org/abs/1812.02893

但随后,他就感觉到了强烈的受挫。

在2020年8月,何杨辉在诺丁汉大学的一场在线讲座中,表达了自己对于用AI发现数学新知识的悲观看法。

当时,他是这么说的:「我没有任何进展,因为我不是这一领域的专家。我甚至都没有找到正确的方法。」

当时的听众之一、威斯敏斯特大学的数学家Thomas Oliver回忆道,他之所以认为数论很难,是因为无法简单地把机器学习应用在数论研究中。

图片

由左至右:Kyu-Hwan Lee,Thomas Oliver,何杨辉

后来,Thomas Oliver便叫上康涅狄格大学的数学家Kyu-Hwan Lee一同,与何杨辉展开了更深度的合作。

「我们最初的目的,只是想了解一下机器学习是什么,而不是真的去深入研究数学,」Oliver说。「但很快,我们发现机器学习可以帮我们理解许多问题。」

Oliver和Lee建议,大家可以用AI研究L函数,即通过序列a_p与椭圆曲线密切相关的无穷级数。

为此,他们利用椭圆曲线及其相关L函数的在线数据库(LMFDB),训练了一个极其学习分类器。

这个数据库收录了超过300万条有理数范围内的椭圆曲线及其相关的L函数。

2020年10月,他们发表了一篇论文,通过分析L函数的信息,来预测椭圆曲线的特定性质。

论文地址:https://arxiv.org/abs/2010.01213

11月,他们再次发表论文,利用机器学习对数论中其他对象进行了分类。

论文地址:https://arxiv.org/abs/2011.08958

到了12月,他们已经能够准确预测椭圆曲线的等级。

论文地址:https://arxiv.org/abs/2012.04084

但即便如此,三人都搞不明白,为什么机器学习算法会如此有效。

本科生接手研究

Lee把揭开这一谜团的任务,交给自己的本科生Alexey Pozdnyakov。

康涅狄格大学的本科生Alexey Pozdnyakov是世界上第一个观察到这种模式的人

Pozdnyakov是这样入手的。

LMFDB通过一个叫做conductor的量,来对椭圆曲线进行分类,这个量概括了曲线在某些质数上表现不佳的信息。

于是,Pozdnyakov尝试同时研究大量具有相似conductor值的曲线,比如conductor值为7,500到10,000之间的所有曲线。

总的来说,这项研究涵盖了大约10,000条椭圆曲线。其中,有大约一半的秩为0,另一半的秩为1(更高秩的曲线极其罕见)。

接着,Pozdnyakov分别计算了秩为0和秩为1的曲线的a_p值的平均数,并将这些数据绘制成图。

结果显示,这两组数据形成了两个截然不同、清晰可辨的波。

而这,就是机器学习能够准确预测特定曲线等级的原因。

最初,Pozdnyakov只是很高兴自己完成了导师交代的任务。

Kyu-Hwan教授立刻敏锐地意识到,这其中绝对有不寻常的发现!

当Lee教授和Oliver教授知道后,他们也非常惊喜。

Pozdnyakov向他们展示了上面的那张图,他们立刻联想到了鸟群在空中飞行时形成的图案。

Kyu-Hwan教授随后查到,这种现象叫做murmuration。

何教授随后提议,将论文命名为「椭圆曲线的murmuration」。

论文地址:https://arxiv.org/abs/2204.10140

论文引起强烈反响

2022年4月,他们将论文上传,分享给一些数学家。

大家忐忑地想,或许这个所谓的发现早就为人熟知,毕竟曲线实在太明显了。

然而,出乎他们意料的是,论文一经发布,立刻引起了数学界的轰动。

MIT科学家Andrew Sutherland对此尤为感兴趣。

图片

Andrew Sutherland

作为LMFDB的管理编辑之一,Sutherland发现,原有的300万条椭圆曲线对于他的研究目标来说,是远远不够的。

他希望通过研究更大范围的conductor,来检验所谓的「murmuration」是否具有普遍性。

因此,他从另一个拥有约1.5亿条椭圆曲线的庞大数据库中提取了数据。但他对此仍然不满足,于是又从另一个包含3亿条椭圆曲线的数据库中再次提取数据。

但是这些还不够!

最后,Sutherland的数据集,包含了超过10亿的椭圆曲线。通过这个数据集,绘制出了非常高清的图像。

图片

他发现,无论是是15000条椭圆曲线,还是100万条,这种「murmuration」始终都会显现。

更令人惊讶的是,即使在椭圆曲线涵盖的质数范围越来越大时,这种图形的形状依然保持不变,这种现象被称为「尺度不变性」。

图片

Sutherland还发现,这种「murmuration」不仅存在于椭圆曲线中,也会出现在更一般的L函数中。

他将这些发现发送给了滑铁卢大学的Michael Rubinstein教授和Sarnak教授。

他对此百思不得其解:「如果这背后有一个已知的原因,我相信你们一定能告诉我」。

图片

然而,他们对此也一无所知。

新公式诞生,数学圈被引爆

2023年8月,何杨辉、Lee和Oliver在布朗大学的计算与实验数学研究所(ICERM)举办了一场专门探讨murmuration的研讨会,并吸引了包括Sarnak和Rubinstein在内的众多学者参与。

会上,Sarnak的学生Nina Zubrilina介绍了自己在模形式中,针对murmuration的研究成果。模形式是一种特殊的复函数,它们与椭圆曲线相似,都有对应的L函数。

图片

Zubrilina发现,在conductor较大的模形式中,murmuration呈现出一种趋向于集中成一条清晰的曲线,而非分散的模式。

随后,她在2023年发表的一篇论文中,证明了这种murmuration遵循一个明确的公式。

图片

论文地址:https://arxiv.org/abs/2310.07681

Sarnak对此评价道:「Nina的重大贡献在于她提出了一个『Zubrilina murmuration密度公式』。她运用了高深的数学知识,证明了一个与数据完美吻合的精确公式。」

尽管这个公式相当复杂,但Sarnak认为它是一种重要的新型函数,甚至可以和定义微分方程解的艾里函数相媲美——后者定义了在物理学中各种情况下使用的微分方程的解,从光学到量子力学。

而Zubrilina公式的提出,直接引爆了这个领域,现在几乎每周都有相关的新论文发布。

Sarnak解释说,这些研究主要是采用Zubrilina的方法,进一步探讨murmuration的不同方面。

Jonathan Bober、Andrew Booker和Min Lee来自布里斯托大学,他们与ICERM的David Lowry-Duda合作,在一篇10月份的论文中证明了模形式存在一种不同的murmuration。

此外,Kyu-Hwan Lee、Oliver和Pozdnyakov还证明了在被称为狄利克雷特征的对象中存在murmuration,这些对象与L函数有着密切的联系。

数学的重大发现,有很多「偶然」

如今回想起来,对于这一发现背后所需的重大运气,Sutherland仍然会不住感慨。

如果当初,椭圆曲线的数据没有按照conductor来排序,那么murmuration可能就不会被发现。

「他们很幸运地使用了LMFDB中已经按conductor预排序的数据,这是关联椭圆曲线和对应模形式的关键,但这并不是显而易见的……两个方程式看似相似的曲线,其conductor却可能大相径庭。」

例如,方程y^2=x^3–11x+6的conductor是17,而将减号改为加号后,y^2=x^3+11x+6的conductor则为100,736。

不仅如此,murmuration的发现,也在一定程度上多亏了本科生Pozdnyakov的经验不足。

「如果没有他,我们可能不会发现这一点,」Oliver说,「因为专家通常会把a_p的绝对值归一化为1。但他没有这样做……因此,振荡才变得非常明显。」

Oliver指出,AI算法用于按等级排序椭圆曲线的统计模式,存在于一个具有数百维的参数空间中——这对人类来说太复杂了,难以在脑海中排序,更不用说可视化了。

虽然是机器学习首先发现了这些隐藏的振荡,但数学家们直到后来才明白,这些振荡实际上就是murmuration。

Yang-Hui He 何杨辉

何杨辉是一位杰出的数学物理学家,目前是伦敦数学科学研究所的研究员,以及牛津大学默顿学院的导师。

与此同时,何教授还在伦敦大学城市学院担任数学客座教授,在南开大学担任长江学着讲座教授,并且还是STEMM全球科学协会主席。

何教授的研究工作横跨量子场理论、弦理论、代数几何和数论等多个领域,并深入探索AI和机器学习在这些问题中的应用,是利用AI进行纯数学研究的领域先驱之一。

目前,何教授已发表超过200篇科学论文,并定期举行公开讲座。此外,他还积极参与科普活动,担任BMUCO顾问和One Garden研究员,致力于将科学知识普及给更广泛的公众。

图片

何杨辉在1975年9月出生于中国芜湖,在中国和澳大利亚度过了他的小学时光,随后在澳大利亚和加拿大完成了高中学业。

1996年,何杨辉以最高荣誉(summa cum laude,同时获得Allen Shenstone奖和Kusaka Memorial奖)从普林斯顿大学获得物理学学士学位,并同时取得了应用数学和工程物理的双重证书。

紧接着,他在1997年以优异的成绩从剑桥大学获得了硕士学位,并在2002年在麻省理工学院理论物理中心完成了他的博士学位研究(获得了美国国家科学基金会奖学金和麻省理工学院总统奖)。

完成在宾夕法尼亚大学的博士后工作后,何杨辉加入牛津大学,担任FitzJames研究员和英国STFC高级研究员。

责任编辑:张燕妮 来源: 新智元
相关推荐

2024-02-26 08:30:00

2024-06-17 08:38:00

2024-06-17 08:45:00

2024-04-08 11:31:57

AI数据

2024-10-14 14:31:36

2024-04-09 09:44:21

数学模型

2023-09-14 13:10:48

2024-10-28 16:20:00

2023-12-16 09:42:12

2024-11-11 13:12:03

2024-06-05 12:45:02

2024-07-29 08:49:00

AI数学

2023-07-03 16:01:51

AI数学

2023-12-06 13:44:00

模型训练

2024-04-23 13:39:39

2024-09-29 14:00:00

AI数学自动化

2024-10-14 09:10:00

2024-08-07 14:59:00

2017-05-16 05:05:34

2024-07-08 13:08:04

点赞
收藏

51CTO技术栈公众号