不久前,AlphaFold3横空出世,直接登上了Nature头版。
新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。
然而,与AlphaFold2不同,这个新一代的超强模型却没有开源。
取而代之的是,谷歌DeepMind推出了一个免费研究平台「AlphaFold Server」,供全球科学家使用。
服务地址:https://gdm-alphafold.corp.google.com/welcome
网站操作简单,只需点击几下,就可以利用AlphaFold3在10分钟内得到预测结果。
但是服务有每日的次数限制,且只能用于非商业研究。同时,相比于开源的AlphaFold2来说,这种使用方式缺失了很多自由度,让一些研究人员觉得差点意思。
——这么做其实无可厚非,毕竟DeepMind也是要盈利的,它的子公司Isomorphic Labs已经开始用AlphaFold3来开发药物了。
谷歌DeepMind希望能在促进科学进步,以及保护自身商业利益上找到平衡。
科学家们感到失望
正所谓,由俭入奢易,由奢入俭难。
谷歌的AlphaFold3在5月9号登上Nature头版,而仅仅两天之后的5月11日,加州大学旧金山分校(University of California,San Francisco)的计算结构生物学家Stephanie Wankowicz,和其他九位科学家共同撰写了一封致Nature的公开信:
公开信地址:https://zenodo.org/records/11206103
信中指出:谷歌DeepMind的这种做法不符合科学进步的原则,科学进步依赖于社区评估、使用和建立现有工作的能力。
此后,有600多名研究人员签署了这封公开信。
公开信的合著者、计算结构生物学家Roland Dunbrack,曾对AlphaFold3的论文进行了同行评审,他对DeepMind没有发布代码感到失望。
「我想要可下载的代码,如果我们可以自由使用AlphaFold3,新的研究成果就会诞生。」
其他科学家怎么说:
AlphaFold是一项千载难逢的突破,对生物科学产生了巨大影响。我认为它的作者最终会获得诺贝尔奖,因为他们解决了一个70多年来一直无法破解的巨大问题。我基本上每天都在工作中使用它,指导药物发现和实验上有用的HBV聚合酶的工程设计。
最新版本的AlphaFold3比以前更强大。它已经在我的实验室中揭示了HBV RNA最初如何与聚合酶结合的结构。不幸的是,他们更改了此版本的使用许可,限制了其用于药物发现。
绕过DeepMind,自己破解
在遭到公开信打脸的两天后,5月13日,DeepMind改头换面,宣布将在六个月内,开放AlphaFold3的代码和模型权重供学术使用。
并且,AlphaFold3服务的每日使用次数限制也上调为20次。
但科学家们似乎不太买账,毕竟有了商业竞争的考量,谁知道你拿出来的是不是阉割版,而且还要等上半年之久。
对于这个未来的版本,科学家们尤其质疑其预测蛋白质结构与潜在药物分子或配体的能力。
Dunbrack表示,「我不认为他们会给我们做任何配体的能力,而AlQuraishi团队正在开发的OpenFold3模型就不会做这种阉割,也不会对商业用途有任何限制。」
Mohammed AlQuraishi是哥伦比亚大学的计算生物学家,他的「OpenFold」团队已经开始编写AlphaFold3的开源版本,他们希望今年完成。
AlQuraishi团队此前开发了大名鼎鼎的OpenFold,作为AlphaFold2的开源重新实现,它的效率要高得多,并且得到的结果也差不多。
「如果这种对我们进行药物发现和关系到人类健康的重要能力封闭在少数人手里,那将是糟糕的。」
科学家们追求AlphaFold3的开源版本还有其他原因,其一就是能够重新训练模型,以更好地模拟蛋白质和潜在药物之间的相互作用。
AlQuraishi团队的OpenFold就使用了与DeepMind相同的公开数据集进行训练。
而对于许多制药公司来说,他们可以利用自己的专有数据重新训练,以提高模型的性能。
虽然但是,「Talk is cheap. Show me the code」。GitHub上的「开源AlphaFold3」早已经开搞了!
项目地址:https://github.com/lucidrains/alphafold3-pytorch
这是由旧金山的独立软件工程师Phil Wang发起的众包工作。
大家有兴趣还可以看看仓库中的其他项目,这位大佬已经开发了几十个AI模型的开源版本,包括著名的Dall-E 2。
此外,西雅图华盛顿大学的计算生物物理学家David Baker,也带领团队开发了名为RoseTTAFold-All-Atom的开源蛋白质和化学预测模型,尽管暂时还打不过AlphaFold3。
AlphaFold3服务器被黑
尽管Wang表示自己的三人团队能在一个月内完成描述AlphaFold3模型的代码。
但最耗时也是最贵的步骤显然是模型的训练(AlQuraishi:「代码是5%的努力」)。
MIT的进化生物学家Sergey Ovchinnikov估计,像DeepMind那样训练AlphaFold3可能需要花费超过100万美元的云计算资源,尽管有可能在不影响性能的情况下偷工减料以降低成本。
AlphaFold3的完全开源版本,将使研究人员能够更好地了解模型的工作原理并扩展其功能。
——在等待的日子里,已经有一些科学家在尝试攻击AlphaFold3服务器来获取一些信息。
Ovchinnikov说,「网上已经有一些黑客攻击,为了获得嵌入细胞膜的蛋白质(与脂肪分子相互作用)的更准确的模型。另一次服务器黑客攻击揭示了一种蛋白质采用的另一种形状。」
AlQuraishi希望,开发AlphaFold3开源版本的推动力将成为一个「警示故事」,提醒学者们依赖DeepMind等科技公司开发和分发AlphaFold等工具的危险。
「他们这样做很好,但我们不应该依赖它,我们需要建立一个公共部门和自己的基础设施。」
网友怎么说?
有网友认为,安全问题是谷歌DeepMind选择不开源的一个重要考量,也许AlphaFold3能帮助制造针对特定人群的生物武器。
我认为令人担忧的是,有人可以用它制造超级朊病毒,或者设计一种非常有效的毒素(使用模型药物发现部分的能力)
对此,有网友表示反对:「担心我们可以制造出一种将接管一切的超级微生物,这是狂妄自大。」
我在科学中学到的一件事是,我们太傲慢了,认为我们可以设计一种超级疾病。现实情况是,微生物世界已经充满敌意,几乎每一种致命的生物都已经进化了。你定制设计的任何东西都可能在离开实验室的那一刻就死了。或者更有可能的是,被干掉并被吃掉。
也有网友似乎玩起了「绝命毒师」:
我一直认为,如果人工智能最终能以某种方式,一步一步地指导你如何只用家居用品来制作这样的东西,那将是疯狂的。
想象一下,让一个人工智能帮你制作氯胺酮,它告诉你去买一大袋盐、果冻、3个钛螺丝、一杯橙汁、一些石膏......然后给你一个非常非常长的步骤,把它们变成氯胺酮。过程可能非常乏味,并且需要做很多工作......但是,如果这在技术上是可行的呢?
——据说,有机化学是史上单人战斗力的巅峰,有了知识的力量,沃尔玛在你眼中就是武器库。
不过,人类对知识和未知的渴望是挡不住的,我们拭目以待即可。