如果要给 AI 领域的 2021 评个最具突破奖,你会选择谁?《science》和《nature》给出的答案都是「蛋白质结构预测」。
今年 7 月,蛋白结构两大 AI 预测算法相继开源,一个是 DeepMind 的 AphaFold2,另一个是华盛顿大学等机构研发的 RoseTTAFold。现在这两大算法被《science》评为 2021 年度突破。
众所周知,蛋白质中的长链氨基酸扭曲、折叠并交织成复杂的三维结构,这些结构可能很难,甚至根本不可能破译。数十年来科学家们一直希望通过基因序列简单地预测蛋白质的结构形状,以开启一个洞察生命运作机理的新世界,但一直进展缓慢。
直到 DeepMind 宣布,人们首次发现了一种通过计算来预测蛋白质结构的方法。即使在不知道相似结构的情况下,AI 也可以在原子层面上精确预测蛋白质的结构。
DeepMind 表示 AlphaFold 可以周期性地以原子精度预测蛋白质结构,在技术上利用多序列对齐和深度学习算法设计,并结合关于蛋白质结构的物理和生物学知识提升了预测效果。AlphaFold 的突破性研究成果将帮助科研人员探索引发某些疾病的机制,并为设计药物、农作物增产,以及可降解塑料的「超级酶」研发铺平道路。
AlphaFold 的论文于 7 月发表在《nature》杂志上,论文地址:https://www.nature.com/articles/s41586-021-03819-2
近日 Alphafold 的缔造者之一 John Jumper 也被评为《nature》2021 年度十大科学人物。
John Jumper
从 2018 年初代 AlphaFold 在国际蛋白质结构预测竞赛(CASP)崭露头角,到 2021 年 AlphaFold2 正式开源,John Jumper 带领 DeepMind 的研究团队克服了重重困难,才让 AlphaFold2 实现了 2/3 蛋白质结构预测的卓越成绩。
同为蛋白质结构预测研究的 RoseTTAFold 也一被《science》评选为 2021 年度突破。
RoseTTAFold 是由华盛顿大学医学院蛋白质设计研究所(Institute for Protein Design)联合哈佛大学、德克萨斯大学西南医学中心、剑桥大学、劳伦斯伯克利国家实验室等机构研发的一款基于深度学习的蛋白质预测工具。RoseTTAFold 取得了媲美 AlphaFold2 的超高准确率,而且速度更快、所需要的计算机处理能力也更低。
RoseTTAFold 发表于《science》杂志上,论文地址:https://www.science.org/doi/abs/10.1126/science.abj8754
从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,意味着它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得神经网络能够集中推理蛋白质的化学部分及其折叠结构。
正如其为人们所惊叹的那样,十几年前一些科学家认为蛋白质结构预测的问题永远无法解决,但今天这已然成为了现实。人工智能带来的最大突破就是把「不可能」变成了「可能」。
扩展来看,不只是对蛋白质结构预测的变革,AI 对整个科研领域还有大量的潜力等待挖掘,这也是 AI for Science 这一主题在今年备受关注的原因,如 AI + 数学、AI + 化学、AI + 医药。
也许,接下来两年会有更多 AI + 科研的突破,大家可以重点关注下。