传奇陨落!
人工智能领域的一位传奇大师,Douglas Lenat于8月31日与世长辞,享年72岁。
Lenat因创建了机器学习程序AM而被授予两年一度的IJCAI计算机与思想奖(IJCAI Computers and Thought Award)。
他是美国科学人工智能协会的创始成员之一,也是唯一一位同时在微软和苹果的科学顾问委员会任职的专家。
他是美国科学促进会(AAAS)、美国科学人工智能协会(AAAI)和认知科学学会(Cognitive Science Society)的会员。
他的研究领域包括:符号机器学习、知识表示、「认知经济」(cognitive economy)、 黑板系统(blackboard system)。
作为Cycorp的CEO,以及Cyc项目的首席架构师。他对人工智能和知识表示的贡献是开创性的。
他的挚友和合作伙伴马库斯,在得知他离世的第一时间,写了一篇长文来悼念他。
这篇感人的文章,介绍了他在人生中的最后时刻,还在奋力工作,希望通过Cyc系统改善大语言模型在常识问题上的表现。
Fridman的播客节目,也曾经采访过他。
Douglas Lenat的传奇一生
1950年9月13日,Lenat在宾夕法尼亚州费城出生,5岁时搬家去了特拉华州的威尔明顿。
六年级时,Lenat在学校图书馆发现了关于Isaac Asimov物理学和生物学的通俗读物。于是,科学成了他对世界如何运转好奇心的探索渠道。
但在Lenat十二岁半时,他的父亲突然离世了,Lenat的家失去了稳定的经济来源,开始频繁搬家。尚且年幼的Lenat把科学当作了一种慰藉,日以继夜地投入到对知识的探索中。
1968年,Lenat进入了宾夕法尼亚大学,此时,越南战争正处于最激烈的阶段。Lenat认为前线的士兵人数严重不足,他很可能会被强制应召。
时代的不确定性让Lenat决定加快在学业上的进度,他开始同时学习物理和数学。
但编程仍是Lenat的爱好,在大学期间,Lenat甚至还成功靠编程养活了自己。
他设计和开发了美国海军数据库问答系统的自然语言界面,而这个设计成为了美国航空母舰上使用的早期在线舰载操作手册。
1972年,Lenat获得了宾夕法尼亚大学数学和物理学学士学位以及应用数学硕士学位。
在上大学时,Lenat对物理和数学感兴趣,但最后他并未选择在这两个领域中深耕下去。
在John W. Carr III 1971年教授的一门课上,Lenat了解到了人工智能。
于是,毕业后Lenat来到了斯坦福大学,并在这里获得了计算机科学博士学位。
提出AM,呼吁AI「常识」研究
在攻读博士期间,Lenat发表了Automated Mathematician(AM)的论文。
AM是第一批试图进行「发现」的计算机程序之一。也就是说,它是一个定理提出者,而不是定理证明者。
对该程序的试验促进了批评和改进的循环,使人们对人类的创造力有了更深刻的理解。
1977年,AM被授予IJCAI计算机和思想奖。AM是迈向通过发现进行学习的科学、迈向将创造性过程去神秘化并证明计算机程序可以做出新颖和创造性发现的第一步。
1976年,Lenat开始在卡内基梅隆大学担任计算机科学助理教授,并开始了人工智能程序Eurisko的研究工作。
在研究中,Lenat发现了AM的局限性:它只能遵循一套固定的趣味性启发式(interestingness heuristics)方法。
相比之下,Eurisko将其启发式规则表示为第一类对象(first class objects),因此它可以探索、操作和发现新的启发式方法,就像它(与AM)探索、操作和发现新的领域概念一样。
1978年,Lenat回到斯坦福大学担任计算机科学助理教授,继续他的研究工作,并建立了Eurisko自动发现和启发式发现程序。
Eurisko取得了许多有趣的发现,获得了巨大的赞誉,Lenat的论文《启发式规则的理论与实验研究》(Heuretics: Theoretical and Experimental Study of Heuristic Rules)获得了1982年AAAI会议的最佳论文奖。
Lenat和在施乐PARC工作的John Seely Brown一起于1984年发表了一份分析AM和Eurisko系列研究的局限性报告。
该报告认为,要想在真正的、通用的、符号化的人工智能领域取得进展,就需要有一个庞大的「常识」知识库,并对其进行适当的形式化和表述。
还需要有一个推理引擎,能够通过将该知识库应用于具体问题和应用,找到数十或数百个深层次的结论和论据。
1984到1994 年期间,Lenat成为了MCC(Microelectronics and Computer Technology Corporation)的首席科学家,不过在这之后,他仍继续回到斯坦福大学,每年教授大约一门课程。
在400人的MCC,莱纳特能够让几十名研究人员而不仅仅是几名研究生研究「常识」知识库。
马库斯发文悼念
作为学术领域的战友,马库斯在得知Lenat离世的消息后第一时间,写了一篇长文,悼念自己好友。
https://garymarcus.substack.com/p/doug-lenat-1950-2023
Douglas Lenat是我见过最聪明,最直率,最聪明的人之一。
如果说Marvin Minsky、John McCarthy和Allen Newell等人是第一批深入思考符号人工智能(symbolic AI)如何运作的人,那么Douglas就是第一个努力让这个系统真正运转起来的人。
我的整个职业生涯都在宣扬神经网络和符号人工智能之间的一致性。
而Lenat领先了我好几光年,他不仅比我更深入地挖掘了这些战壕,而且是这些战壕的建筑师。
他在人生的后40年里发起并主持了一个名为Cyc的项目,想要将所有常识转化成机器可解释形式的一个项目。
如今很少有人会认真思考人工智能,甚至很少有人知道这个项目是什么。
很多人都认为这个项目并不成功。
因为Cyc(以及Lenat为孵化Cyc而成立的公司Cycorp)从未在商业上取得很大的反响。
但几乎没有人意识到这个项目在40年后仍在运转是一件多么了不起的事情。因为很少有人工智能公司能生存地如此长久。
而我个人的看法是,Cyc既没有成功,也没有失败。它处于成功和失败的中间状态。
它是一个开创性的,旗帜般的实验,虽然没有完全成型。
Cyc虽然没有能引起全世界的关注,但当人类在通用人工智能方面取得真正进展的时候,一定会发现,它变得越来越重要了。
倒不是说Cyc会替代大语言模型,但是Lenat想要做的事情——让机器对常识进行表征和推理仍然亟待完成。
Yejin Choi在2023年的TED演讲「为什么人工智能如此的不可思议的聪明却又如此令人震惊的愚蠢」就是关于这个主题的延续,解释了为什么目前的AI系统尽管取得了显著的成功,但是仍然缺乏最基本的常识。
打个比方,Lenat试图找到一条穿越常识之山的道路。
常识是我们知道的关于世界的数不清的基本知识,但人类却很少在语言中把常识表达出来。
Lenat没有完全成功——需要寻找一条不一样的道路——但他却指出了我们必须跨越的那座关键的山峰。
这就是Lenat、Choi、Davis和我一直在努力传达的问题,同时也是大型语言模型一直处理不好的地方。
随便举一个例子,今天早上,有人给我发了封邮件,用Google Bard把事实和明显的废话混在一起,用非常流畅的语言表达了出来。
一公斤的砖和两公斤的羽毛是一样重的
因为措辞内容的差异,使得任何大语言模型对这个问题会给出完全不同的答案。
大语言模型往往能准确地描述和回答一些问题,又会对一些问题讲得完全不知所云,经常犯一些常识性的错误。
它的表现完全取决于不可控的训练数据,以及提问时具体的语言表述。
就算某个错位被人为的纠正了,依然会难以避免出现其他的常识性错误。
Cyc就是在试图寻找到让AI能给出更加有深度以及可靠的答案。
正如西北大学人工智能研究员Ken Forbus今天上午在一封电子邮件中对我说的那样:
「Cyc项目首次证明了符号表示和推理可以扩展到捕捉常识的重要部分。
虽然现在包含数十亿事实的知识库在行业中时很常见的事,但Cyc在表达能力方面仍然是最先进的,它能捕捉到人类所能捕捉到的更多思想。
我的团队几十年来一直在研究中使用Cyc的表征……我们的领域将从Cyc项目中学到更多的东西。」
谷歌研究员Muktha Ananda,谷歌学习平台的主任,今天早上写信给我表示哀悼:
「我一直非常钦佩Lenat的远见、毅力和坚韧。 他在Cyc上的工作对我自己的知识图谱的一个很大的灵感来源。」
在过去的一年里,Douglas和我试图写一篇又长又复杂的论文,但我们一直没能完成。
Cyc涉及的范围是令人敬畏的,但却很难实现。
从学术角度来看,Cyc最大的问题是它的专有性(proprietary)。
为了帮助更多的人了解Cyc,我试着从他身上找出Douglas从Cyc身上学到的经验教训,供未来的研究人员参考。
我们希望回答,Cyc的作用原理是什么?为什么有时候又完全没有效果。
我们写了将近4万字的内容,还没有完全来得及整理成通顺的论文,但内容却充满了智慧。
其中,一部分是科学论文,一部分是口述的历史。
不用说,组织和润色这种长度的内容需要花费很长时间。
加上我们还有些一些其他工作要做,所以进展比较缓慢,但是很稳定。
而今年,我忙于人工智能政策方面的工作,他却生病了,导致进展进一步放缓。
快要完成之时,他基于我们俩的工作,写了一篇更短、更紧凑的论文。
当他意识到时间所剩无几时,我们决定我来帮他润色那份较短的手稿。
我们都意识到这可能这是他最后一篇论文的最后一次合作了。
大约六周前,他发给我的最后几封邮件中,有一封希望我尽快把论文发出去。
7月31日,在仓促的修改之后,论文在arXiv上发布了:
「从生成AI到可信赖AI:大语言模型可以从Cyc中学到什么」
这篇简短的文章回顾了Cyc想要达到的目的,概括了我们应该从真正的人工智能中得到什么,并尝试在深刻的符号传统与现代大型语言模型之间进行折中和调和。
以他的名义,我希望大家能抽出时间读一读这篇论文。
网友悼念
很多网友在得知他去世的消息时,也在网上分享了和他打交道的过程,表示了对大师离世的不舍。
这位网友曾经是他Cycorp的员工,分享了一段他慷慨地将自己新车送给员工的轶事。
一位网友对Lenat给予了他改变自己一生的实习机会表达真挚的感谢,并从Lenat身上汲取了很多人生经验。
一位只和Lenat有过「一面之缘」的网友,同样对他表示了感谢。