众所周知核聚变比现在普遍使用的核裂变方式更安全和环保。但如何控制核聚变是一个大难题,迄今为止人们也只能在实验室进行核聚变反应的应用研究。多亏了人工智能,核聚变现在似乎比以往任何时候都更接近实际应用。
瑞士洛桑联邦理工学院(EPFL)的研究人员利用在等离子体物理和控制方法方面的丰富经验,联合谷歌子公司DeepMind的人工智能研究和技术。获得一种新的基于深度强化学习的等离子体组态磁控制方法。
该方法的细节发表在《自然》杂志上,并应用于瑞士等离子体中心(SPC:Swiss Plasma Center)研究设施的一个真实世界的等离子体系统——可变配置托卡马克(TCV: Variable-Configuration Tokamak)。
托卡马克(磁约束核聚变:目前被认为是最有前途的可控核聚变方式)是一种甜甜圈形状的聚变研究装置,它利用强磁场将等离子体限制在比太阳核心(数亿摄氏度)还高的温度下。就像太阳一样,极端的温度促进了氢原子之间的核聚变。SPC的托卡马克能够实现可变的等离子体配置(即等离子体在托卡马克中的形状和位置),可以用来探索新的发电方式。
以往这一过程本身就不稳定,出现了一些难题。包括如何防止等离子体脱离一系列允许等离子体形成的线圈,以及如何保持等离子体的位置。TCV的19个独立线圈必须通过独立的控制系统配置进行连续校准。控制器使用算法,实时估计等离子体的特性,以适应磁铁的电压达到预期的结果。这些等离子体控制系统对于防止等离子体到达托卡马克的外围壁体是至关重要的,它会阻止反应并损害设备本身。
幸运的是,控制系统配置可以在托卡马克中使用之前进行模拟。但即便如此,为了确定控制系统中每个变量的正确值,仍需要进行冗长的计算。这就是与DeepMind的联合研究项目的切入点。
DeepMind开发了一种人工智能算法,在SPC的模拟器上进行训练,大大缩短了建模这些模拟所需的计算时间和能量,同时允许仅用一个控制器就可以操纵等离子体。控制器是一个单一的神经网络,它同时协调所有19个线圈,同时学习哪个电压能产生特定的等离子体配置。
训练这种算法意味着模拟各种控制策略并收集数据或“体验”。该算法可以创建一个控制策略“以产生所要求的等离子体配置”,这涉及到算法运行多个控制设置并分析产生的等离子体配置。然后,通过要求算法根据正确的设置生成特定的等离子体配置,再去真实的托卡马克中进行配置调整。
模拟是有前途的。据EPFL发布的消息,DeepMind的人工智能算法“能够创建和维护多种等离子体形状和先进配置,包括在容器中同时维护两个独立的等离子体。”该算法随后被用于实际的托卡马克,以测试其在现实世界中的应用,这与验证他们的结果一样有希望。
最初的合作始于DeepMind的黑客松(黑客马拉松,计算机技术的一种竞赛方式),偶然提到了托卡马克磁线圈控制的问题。DeepMind立即对在核聚变等领域测试他们的人工智能技术的前景产生了兴趣,尤其是在托卡马克这样的现实世界系统上。
此次合作的成功表明,人工智能有潜力加快核聚变科学的发展。DeepMind指出,他们的方法可以用于设计和扩展新的托卡马克及其控制器。他们还预测,强化学习(RL)将成为一种“变革性技术”,可以用于控制其他工业和科学应用中的复杂机器。
至于人类向核聚变能源的发展,我们可能还没有像《回到未来》中那样,每人都拥有一个“核聚变家用能源反应堆”,但人工智能可能是实现这一目标的有力帮手。