世界上第一个聊天机器人并非旨在成为聊天机器人
ELIZA,这个被广泛认为是世界上第一个聊天机器人的程序,由Joseph Weizenbaum于1960年代初在麻省理工学院开发。它通过模拟罗杰斯心理治疗师的非指导性咨询方式,与用户进行交流,其表面的简单性背后却隐藏着对人类交流本质的深刻探索。
Weizenbaum的初衷是创建一个研究自然语言通信的平台,而不是一个与人类用户进行对话的程序。他选择了罗杰斯心理分析师和患者之间的对话作为模拟背景,因为这种设置可以简单地创造出“相互理解的幻觉”。Weizenbaum在寻找一个能够维持这种幻觉的背景时,需要一个无知不会破坏理解幻觉的环境。然而Weizenbaum在1966年的论文标题和他后来给McCorduck的解释之间存在差异,这表明ELIZA实际上是作为研究人机通信的平台而非模拟或讽刺心理分析师和患者之间对话的程序。要理解这种误解的细节,我们需要了解ELIZA出现的背景,以及它是如何进入公众视野的。
人们对ELIZA的初衷和功能的理解出现了偏差,他们往往将其简化为一个旨在模仿人类对话的程序。近期,Jeff Shrager在其文章《ELIZA Reinterpreted: The world’s first chatbot was not intended as a chatbot at all》中对此进行了重新解读,揭示了ELIZA背后更深层次的意图和价值。作者Jeff Shrager是斯坦福大学符号系统项目的兼职教授,同时也是Blue Dot Change的成员。Shrager在计算和实验室分子生物学领域拥有超过二十年的经验,专注于生物系统的建模和分析。Shrager对人工智能领域的贡献在于他对ELIZA的重新解读,突出了这个世界上第一个聊天机器人的历史背景和重要性。
ELIZA的诞生与初衷
在20世纪60年代,计算机科学家Joseph Weizenbaum在麻省理工学院的工作室中创造了ELIZA——这个名字源自于萧伯纳的戏剧《卖花女》,其主人公通过模仿上层社会的言谈举止实现了阶级跨越。Weizenbaum的ELIZA也是为了探索人与机器之间的交流边界而设计的。在那个计算机还未普及的年代,ELIZA的出现无疑是一次大胆的尝试,它开启了人们对于计算机能否模拟人类对话的广泛讨论。
Weizenbaum开发ELIZA的初衷并非创建一个能够通过图灵测试的聊天机器人,而是为了研究人类如何与机器进行交流,以及人们如何将机器输出的信息解释为有意义的对话。ELIZA最著名的“医生”脚本,模拟了罗杰斯心理治疗师的非指导性咨询方式,其目的是为了观察人们在与看似理解他们的机器交流时的行为和反应。
当时的AI研究正处于起步阶段,主要集中在解决逻辑问题和模式识别上。ELIZA的出现,虽然技术上简单,却在人工智能的发展史上留下了深刻的印记。它不仅挑战了人们对于机器智能的传统认知,也为后来的自然语言处理和人机交互研究提供了宝贵的启示和灵感。ELIZA证明了即使是基于简单规则的程序,也能在一定程度上模拟人类的交流方式,引发人们对于AI能力和未来发展的无限遐想。
通过对ELIZA的诞生背景、Weizenbaum的初衷,以及ELIZA与当时AI研究的关系进行深入分析,我们可以更全面地理解这一历史性的创新如何影响了计算机科学和人工智能的发展轨迹。ELIZA不仅是一个技术上的突破,更是一个文化和社会现象,它揭示了人类与机器之间复杂而微妙的关系,以及在这一关系中所蕴含的广泛意义和可能性。
ELIZA的技术实现与局限性
ELIZA是在20世纪60年代由Joseph Weizenbaum开发的,它通过模式匹配和替换规则来处理用户输入的自然语言。ELIZA的核心是一个脚本解释器,它能够识别用户输入中的关键词,并根据预设的脚本回复相应的语句。这种方法使得ELIZA能够在没有真正理解对话内容的情况下,模拟一种看似有意义的交流。例如,如果用户提到“母亲”,ELIZA可能会回复“告诉我更多关于你的家庭。”这种简单的关键词响应机制,虽然技术上不复杂,却成功地创造了一种机器能够“理解”和参与人类对话的幻觉。
IPL作为一种编程语言,其外观不太美观,与汇编语言相差无几,而且作为一种解释型语言,它比汇编语言或随后出现的“高级”编译语言(如COBOL和Fortran)要慢。这些编译语言承诺给程序员提供高性能和表达的简洁性。这引出了SLIP和Lisp,它们采取了不同的路径来为IPL中开创的重要AI概念带来简洁性和额外的能力。
Weizenbaum通过多种途径与AI联系在一起,包括对模拟神经症和偏执症感兴趣的斯坦福大学精神病学家Kenneth Colby,以及伯克利的计算机科学家Ed Feigenbaum。Feigenbaum是Simon的学生,并在IPL中创建了各种AI程序。Weizenbaum到达MIT后,他加入了由Lisp的发明者、人工智能术语的创造者John McCarthy部分发起的Project MAC。
Weizenbaum首先是一名软件工程师,他刚从GE公司来,曾在那里工作过实用程序。有几个项目旨在在Newell和Simon的IPL工作的成功基础上进行构建,而不必处理其丑陋和低效。如上所述,已经有了几种更加友好的编程语言,特别是Fortran和COBOL。但这些语言针对的是科学、工程和商业,并没有提供IPL的AI相关功能,如符号处理、列表和递归。因此,自然会产生一个问题,如何将这些能力添加到那些已经存在的语言中。
Gelernter和他的同事在创建FLPL(Fortran列表处理语言)时,简洁地捕捉了Fortran、IPL和Lisp之间的创造性纠缠:“在IBM 704计算机上使用JOHNNIAC IPL的翻译工作得到了考虑。然而当时为该项目提供咨询的J. McCarthy建议可以将Fortran适应于相同的目的。他指出Fortran格式内允许的函数嵌套使得可以用单一语句构建复杂的信息处理子程序。作者们后来发现,[Newell、Shaw和Simon]列表的结构与语言内可以编写的某类代数表达式之间存在密切的类比。当然不容忽视的是Fortran编译器本身所包含的相当复杂的技术,所有这些技术当然都延续到我们的Fortran编译列表处理语言中。可以合理估计,用我们的语言编写的例程将比用解释型语言(如IPL)编写的同一程序运行速度快约五倍。”
像Gelernter一样,Weizenbaum也实现了一套受IPL启发的列表处理功能,作为一组可由Fortran(后来是MAD)调用的函数,他称之为SLIP。在创建SLIP时,Weizenbaum采取了与Gelernter类似的路径。在他1963年的论文中,Weizenbaum(除了引用IPL和FLPL作为影响)批评了McCarthy的Lisp(尽管没有提到它的名字):“列表处理已经赢得了一些忠实的转换者。但是有些人在倡导列表处理方面变得过于热情。虽然有些编程任务最好完全在某些列表处理系统内解决,但大多数普通程序员面临的任务需要应用多种不同的技术。在一个工具箱内打包多种工具似乎是为解决复杂问题的工人配备装备的一个好方法,如果不是最佳方法。FORTRAN、ALGOL和其他同类型的语言提供了极好的工具。除了它们本身非常强大之外,它们还有一个优势,那就是它们非常知名。因此,掌握这些新技术的任务就变成了向已经吸收的语言词汇中添加新词汇,而不是学习一种全新的语言。”
1963年SLIP论文中的致谢部分值得完整引用,因为它明确了许多联系:“SLIP对之前的列表处理系统有相当大的债务。然而其某些特性更多是为了构建一个供行为科学家使用的符号操作器,而不是泛化其他处理器。在这方面,斯坦福大学的Kenneth Colby博士和加州大学伯克利分校的Edward Feigenbaum博士的持续和慷慨的建议和支持值得感激。作者还要感谢加州大学伯克利分校的Howard Sturgis和斯坦福大学的Larry Breed,他们使该系统在各自计算中心的计算机上运行起来。”
在Lisp和IPL-V中,符号是命名指针,这些语言是自包含的,对符号操作有特定的支持。因为SLIP嵌入在另一种语言中(最初是Fortran,后来是实现ELIZA的MAD),如果程序员选择这样做,命名结果来自于Fortran对变量的赋值。追踪编程语言、人工智能和认知科学历史中“符号”含义将需要另一篇完整的论文。
尽管ELIZA在当时引起了广泛关注,但它在人工智能领域的局限性是显而易见的。首先,ELIZA缺乏真正的理解能力,它无法构建对话的上下文,也无法记忆过往的交流内容。其次,ELIZA的交流能力完全依赖于脚本的质量和复杂性,它不能自主学习或适应新的对话模式。此外ELIZA的模式匹配方法在处理复杂或非预设的输入时表现不佳,容易产生不相关或荒谬的回答。
尽管ELIZA本身存在局限,但它对后来人工智能的发展产生了深远的影响。ELIZA开启了自然语言处理和人机交互研究的新篇章,激发了对话系统和聊天机器人的进一步探索。ELIZA的出现证明了即使是基于简单规则的系统也能在一定程度上模拟人类的交流方式,为后续更复杂的自然语言处理系统奠定了基础。ELIZA的设计思想和技术方法也为现代AI中的大型语言模型和机器学习算法提供了宝贵的参考。
ELIZA与图灵测试
图灵测试由英国数学家和逻辑学家艾伦·图灵在1950年提出,旨在评估机器是否能够展现出与人类不可区分的智能行为。测试的基本形式是一个“盲”测试,其中一名人类审问者通过打字的方式与一个人类和一个机器进行交流,但不知道哪个是机器。如果审问者无法可靠地判断哪个是机器,或者机器的表现与人类相当,那么机器就被认为通过了图灵测试,展现了人类水平的智能。
图灵机是Turing对20世纪初期一系列探究的贡献,这包括Turing、Kurt Godel和Alonso Church,他们都在解决Hilbert和Ackerman在1928年提出的“Entscheidungsproblem”。Hilbert的挑战是找到一个算法来确定数学命题是否可证明。Godel通过我们现在称为“Godel Numbering”的方法解决了这个问题,他将数学表达式转换成数字,并展示了在一个完整系统中有些表达式是无法证明的。Church通过形式化通用递归函数在一个称为“Lambda Calculus”的系统中达到了相同的结论。Turing通过描述一个可以计算任何函数的通用机器来解决这个问题。Turing然后展示了,与Godel和Church等价地,有些程序是不可能证明它们会在他的机器上停止运行的,我们现在称之为“停机问题”。
Turing对通用计算机、可计算函数和智能的兴趣之间的联系是显而易见的:如果一台机器可以计算任何函数(暂且不考虑可证明性,这与人类智能并不直接相关),并且智能被认为是某种函数(这可能是另外一个争论点,但是Turing假设了这一点),那么如果一个人的目标是理解智能甚至可能创造一个智能机器,那么能够判断你是否成功就变得很重要——因此,Turing发明了模仿游戏,现在著名的“图灵测试”。
ELIZA作为一个模拟人类心理治疗师的程序,其对话能力在当时被认为是相当先进的。然而ELIZA的设计并不是为了通过图灵测试。它的对话能力完全依赖于预设的脚本和模式匹配技术,缺乏真正的理解和学习能力。尽管有些用户可能会被ELIZA的回答所迷惑,认为它表现出了一定程度的智能,但从技术上讲,ELIZA并没有达到图灵测试中所要求的智能水平。它更多地展示了人类如何容易地被机器的表面行为所欺骗,而不是机器本身的智能。
Weizenbaum对图灵测试持批判态度。他认为即使机器通过了图灵测试,这也并不意味着机器真正理解了交流的内容或具备了智能。Weizenbaum通过ELIZA展示了机器如何在没有真正理解的情况下模拟对话,从而质疑了图灵测试作为智能评估标准的有效性。他强调,人们不应该仅仅因为机器的表面行为就轻易地归结为它具有智能。Weizenbaum的观点提示我们,在评估AI的智能时,需要更深入地考虑机器的内部工作机制和它们如何处理和理解信息。
通过对图灵测试的概念、ELIZA是否符合图灵测试的要求,以及Weizenbaum对图灵测试的看法的分析,我们可以更全面地理解ELIZA在人工智能史上的地位,以及它对后续AI研究和评估标准的影响。ELIZA的案例教会我们,评估AI的智能不应仅仅基于外部表现,而应深入探讨其内部逻辑和处理能力。
ELIZA的社会影响
ELIZA作为早期人工智能的代表作,在社会上引起了广泛的关注和讨论。它不仅在科技界产生了轰动,更在普通大众中激发了对于与机器对话可能性的好奇心。ELIZA的出现,使得人们开始思考计算机是否能够理解人类情感,甚至是否能够取代心理医生等专业人士。在某种程度上,ELIZA加速了人们对未来人机交互方式的想象,推动了对话系统和智能助手的发展。
尽管ELIZA在当时被视为一种突破,但人们对其实际能力的理解存在误区。许多用户被ELIZA表面上的响应所迷惑,认为它具有真正的理解和情感反应能力。但是这种误解恰恰反映了Weizenbaum希望探讨的问题:人们如何将机器输出的信息人性化,并赋予其超出其真实能力的智能。正确地理解ELIZA,意味着认识到它仅仅是一个基于预设脚本运行的程序,而非具备真实智能的实体。
ELIZA对人机交互研究的贡献不容小觑。它提供了一个研究平台,让研究人员能够观察和分析人类如何与机器进行交流。通过ELIZA研究人员能够探索如何设计机器以更自然、更具吸引力的方式与人交流。此外ELIZA的出现也促进了对人类交流模式的研究,包括语言的模式识别、情感表达和社会互动的复杂性。ELIZA的案例为后来的人机交互研究提供了宝贵的经验和启示,对现代AI中的自然语言处理和对话系统的发展产生了深远影响。
ELIZA的再解读
Jeff Shrager在其文章中提出了对ELIZA的新解释,强调ELIZA并非旨在成为一个聊天机器人,而是作为一个研究工具,用于探索人机交流的复杂性和人类如何解释机器行为。Shrager指出,Weizenbaum开发ELIZA的真正目的是为了研究人类对于机器输出的理解和反应,而非创造一个能够通过图灵测试的智能系统。这一点揭示了ELIZA在人工智能史上的真实地位,它是一个探索和实验的平台,而不是一个终点或成果。
ELIZA作为一个研究平台,为人机交互的研究提供了丰富的案例和数据。它展示了人们如何容易地将机器的输出解释为具有情感和理解的交流,即使这些输出完全是基于预设的规则和模式。这种现象对于研究人类如何与AI交流,以及如何改善AI系统的设计以更自然地与人类交流具有重要意义。ELIZA的案例也为认知科学、心理学和社会学等领域提供了研究人类沟通和理解过程的新视角。
尽管ELIZA在技术上已经过时,但它在现代AI研究中仍然占有一席之地。ELIZA的设计思想和方法启发了后来的自然语言处理和对话系统的发展,特别是在模拟人类对话和情感反应方面。现代的AI对话系统,如Siri、Alexa和其他智能助手,都在某种程度上借鉴了ELIZA的概念。此外,ELIZA的案例继续作为教学和研究的工具,帮助新一代的AI研究者和开发者理解人机交互的复杂性和挑战。
结语
ELIZA作为人工智能史上的一个标志性项目,其历史意义远超过了它的技术成就。它不仅引发了公众对于AI能力的广泛讨论,更重要的是它揭示了人类对于机器智能的深层心理预期。ELIZA的设计和运作方式教会我们,即使是基于最简单规则的程序,也能够引起复杂的人类反应和情感投射。这一点对于理解人机交互的本质至关重要,它提示我们在设计和评估AI系统时,我们需要考虑到用户的心理和社会反应,而不仅仅是技术性能。
未来的AI研究应当从ELIZA的案例中吸取教训,更加关注于AI系统的社会和心理影响。研究者们应当探索如何设计出能够更深入理解人类语言和情感的AI系统,同时也要警惕AI在模仿人类行为时可能引起的误解和道德问题。此外,AI的发展也应当注重透明度和用户教育,帮助公众正确理解AI的能力和局限,避免过度人性化的期待。
在技术层面,未来的AI研究可以继续探索更复杂的自然语言处理算法,提高AI的上下文理解能力,以及在长期交互中保持一致性和相关性。同时,跨学科的合作也将是未来AI研究的关键,心理学、认知科学、社会学等领域的知识将对于创建更加智能和敏感的AI系统至关重要。
ELIZA的故事是一个关于技术、心理和社会交织的复杂叙事,它提醒我们,人工智能的发展不仅是计算机科学的进步,更是人类文化和社会结构变革的一部分。未来的AI研究需要在这些层面上进行深入的思考和探索,以确保技术的进步能够为人类社会带来真正的福祉。
参考资料:https://arxiv.org/pdf/2406.17650
本文转载自大噬元兽,作者: FlerkenS