麻省理工学院的研究人员利用一种机器学习算法,成功发现名为Halicin的新型药物,其在多轮实验中表现出强大的杀菌能力。Halicin(上排)能够阻止大肠杆菌对抗生素产生耐药性,而环丙沙星(下排)明显不具备这种特性。
深度学习有望成为应对细菌耐药性难题的有力工具。此次新算法发现的药物已经在实验室测试当中有效杀灭多种致命细菌,甚至包括一部分已经出现耐药性的菌株。该算法还在另外8项计算机模拟测试中分别找到具有发展前景的候选药物分子结构。
我们要如何建立起一套能够发现抗生素的神经网络?答案可能与大家直观判断不同。我们要做的不是手把手教它学习生物化学原理,而是像Google大获成功的国际象棋与围棋程序AlphaZero那样,允许它自己从零开始自由摸索。
麻省理工学院生物工程系博士后研究员Jonathan Stokes表示,“我们不必预先向计算机提供任何信息。我们要做的,只是输入一个分子以及一条属性标签,让计算机判断在当前情况下,该分子是否具有抗菌性。以此为基础,模型会自行了解哪些分子特征对抗菌能力间的关系更密切,哪些分子特征能够更好或者更差地支持抗生素活性。”
正如研究人员在AlphaZero项目中发现的那样,设计精良的深度学习模型在遇到定义明确、但又不受人类固有规则束缚的问题时,往往能够快速开辟出前所未有的解决思路。
Stokes表示,他和几位来自麻省理工、哈佛大学以及加拿大麦克马斯特大学的联合作者们,共同设计出一种能够了解分子化学性质的深度学习算法。在这种情况下,该化学性质算法在预测模拟分子的溶解度方面显著优于其他计算机模拟程序。
Stokes指出,这项最新研究则进一步探索,希望将灭菌功效设定为该算法的另一可预测化学性质。
小组选取1000多种FDA批准药物与一批来自植物或泥土的天然化合物建立起数据库,并借此训练自己的这套神经网络。数据库中的2335个分子都具有众所周知的化学结构,以及非常明确的抗菌/非抗菌特性。
在模型训练完成之后,他们开始尝试分析新的药物数据库。后者包含6000多种已经被FDA批准为合格药物、或者正处于FDA审批阶段的化合物分子。
Stokes指出,该团队主要关注两个参数:抗菌功效(由深度学习算法确定)以及与其他已知抗生素之间的化学相似性(利用Tanimoto Score数学公式计算得出)。他们希望在Broad Institute的药物重用中心内发现有效的抗生素化合物,同时确保这些潜在的新型抗生素在化学结构上不同于以往任何已知的抗生素分子。
之所以需要保证与已知抗生素结构不同,是因为事实证明具有相似结构的分子同样无法解决菌株持续产生的强大耐药性。
通过这种方式,该小组最终发现了这种名为Halicin的全新抗生素分子。尽管最初开发诉求在于找到一种治疗糖尿病的药物,但Halicin似乎在抗菌方面表现更强,而且拥有与四环素族抗生素以及β-内酰胺类抗生素(其中最知名的一员正是青霉素)完全不同的分子结构。
他解释道,“Halicin与任何现有抗生素都截然不同。大家可以随意联想,猜测它可能属于其中某一类。但事实证明并不是,它前所未有。这真的很酷。”
为此,他们还针对多种已知危险细菌(例如大肠杆菌)进行了测试;同时尝试利用Halicin作为霜剂治疗实验室小鼠身上出现的皮肤感染——任何现有抗生素都无法治愈这种感染。
Stokes表示,“我们对小鼠的局部皮肤使用Halicin,一天涂抹数次。接下来,我们会观察经过一天的治疗,小鼠身上还残留多少存活的鲍氏不动杆菌。结果发现,Halicin确实能够消除感染症状。”
在成功的激励下,研究小组随后又利用这套模型分析更为广泛的数据集,即包含超过1.2亿种化学分子的ZINC 15在线数据库。
他们再一次向抗菌领域发起冲击,希望在满足抗菌功效要求的同时,保证新分子在化学结构与已知抗生素尽可能拉开距离。通过这种方式,他们进一步筛选出8种候选分子,但目前还没有像Halicin那样接受实验室测试的考验。
Stokes表示,他们的小组致力于利用深度学习模型发现窄谱抗生素。
他总结道,“我们正在训练新的模型,希望找到仅对特定细菌病原体具有活性、但不会影响到肠道微生物的抗生素。”
此外,他表示窄谱抗生素的一大优势,在于不太可能像广谱抗生素那样引起严重的耐药性。“我们目前的抗生素往往对多种不同细菌同时具有活性,这一基本事实导致抗生素耐药性的持续蔓延。相比之下,窄谱药物能够有效抑制这种耐药性传播,为治疗疾病探索出一条新的可持续道路。”