人工智能利维坦:从霍布斯社会契约论视角探索LLM 智能体的社会进化 精华
随着人工智能在解决复杂问题的深入,我们急需探索LLM智能体在模拟环境中的社会行为,特别是它们如何从自然状态过渡到建立社会契约的联邦状态。核心问题包括LLM智能体是否能够展现出类似人类的社会契约形成过程?不同的环境和智能体参数如何影响这一过程?以及这些观察结果对于理解人类社会动态有何启示?
6 月 21 日发表的引起行业重视的论文《Artificial Leviathan: Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory》 研究通过模拟智能体社会,和其中复杂的社会关系随时间动态形成和演变,探索了大型语言模型(LLMs)和人工智能(AI)的进步为计算社会科学研究提供了规模化的机会。智能体被赋予心理驱动力,并置于一个沙盒生存环境中。通过托马斯·霍布斯的社会契约理论(SCT)的视角对智能体社会进行评估,分析智能体是否如理论所假设的那样,为了逃离残酷的“自然状态”,而放弃权利给一个绝对主权者以换取秩序和安全。实验揭示了一个一致性,最初智能体在不受限制的冲突中参与,反映了霍布斯对自然状态的描述。然而随着模拟的进展,社会契约出现,导致授权一个绝对主权者并建立一个基于相互合作的和平共同体。我们LLM智能体社会的进化轨迹与霍布斯的理论账户之间的一致性表明LLMs能够模拟复杂的社会动态,并可能复制塑造人类社会的力量。通过使我们能够洞察群体行为和出现的社会现象,LLM驱动的多智能体模拟,虽然无法模拟人类行为的所有细微差别,但可能有助于推进我们对社会结构、群体动态和复杂人类系统的理解。
本研究由来自纽约大学和伊利诺伊大学厄巴纳-香槟分校的研究团队共同完成。团队成员包括Gordon Dai、Weijia Zhang、Jinhan Li、Siqi Yang、Chidera Onochie Ibe、Srihas Rao,以及来自加州大学圣巴巴拉分校的Arthur Caetano和Misha Sra。团队成员在人工智能、社会模拟和进化心理学等领域拥有深厚的研究背景,他们的跨学科合作为本研究的成功奠定了坚实的基础。
图1:该图像显示了LLM智能体运行的模拟环境。介绍了两种类型的资源(粮食和土地)。智能体人每天在耕种(用他们的工作生产食物)、交易(交换资源)或与其他智能体人发生冲突(以获取更多资源为目标)之间做出选择。他们的主要动机是生存。
他们的主要贡献如下:
1.一个新颖的多智能体模拟框架,产生可信的人工社会,能够动态复制复杂的人类群体行为和社会互动。这些出现的社会动态受到智能体的内在心理驱动力、他们的内在动机和他们模拟环境的限制之间相互作用的调节。
2.通过系统实验,提供了智能体属性(例如,记忆、激励)和可用资源之间的关系,以及模拟社会的进化轨迹之间的经验证据。这些发现突出了模拟中社会出现和变化的基本因素。
3.分析生成智能体的集体行为的讨论,突出了利用LLMs进行社会模拟的机会和潜在风险,这可能对社会科学研究产生影响。
4.一个可扩展的社会模拟平台,使研究人员能够通过可定制的场景配置来操作广泛的社会科学假设,使探索群体动态、社会组织和塑造人类经验的力量成为可能。
相关工作
传统的计算机社会模拟研究起源于对社会现象的数学建模,旨在通过计算机程序来模拟和理解人类行为和社会结构。早期的模型如Schelling的种族隔离模型和Axelrod的囚徒困境模拟,都是为了探索个体行为如何在宏观层面产生复杂的社会现象。这些模型虽然简化了现实世界的复杂性,但为理解社会动态提供了有价值的洞察。然而这些模型通常局限于特定的规则和假设,缺乏适应性和智能性,难以捕捉到人类行为的丰富多样性和不确定性。
随着人工智能技术的发展,基于LLM的模拟成为了研究社会现象的新前沿。LLM能够处理和生成自然语言,使得模拟更加接近人类的交流方式。最近的研究开始利用LLM来模拟国家间的决策过程、社会互动和群体行为。这些模拟不仅能够生成更加真实的社会互动场景,还能够在动态环境中测试不同的社会科学假设。LLM的这一应用展现了其在社会科学研究中的巨大潜力,尤其是在探索人类行为和社会结构的演化过程中。
霍布斯的社会契约论是西方政治哲学的重要里程碑,它提出了一个关于社会秩序和国家形成的理论框架。霍布斯认为,在自然状态下人类为了自身的生存和利益,会通过建立契约来形成社会和政治结构。将这一理论应用于LLM智能体的社会模拟,可以帮助我们理解智能体如何在没有中央控制的情况下自发形成社会结构。通过模拟智能体的交互和契约形成过程,研究者可以观察到类似于人类社会演化的复杂动态,从而为设计和理解智能社会系统提供新的视角。
研究方法
模拟环境的构建是实验的基础。研究团队设计了一个沙盒式模拟环境,其中LLM智能体被赋予了不同的心理特征和生存需求。这些智能体需要在一个资源有限的世界中生存,他们的行为受到了霍布斯社会契约论的指导。智能体的设计考虑了进化心理学的原则,如自我保存、财产欲望和社会地位等。每个智能体都有一套独特的属性,如攻击性、贪婪和力量,这些属性通过正态分布随机生成,以模拟人类社会中个体差异的现实。
智能体位于一个自然世界中,食物和可耕地是生存的基本要素。这种设置可以看作是与Maslow需求层次结构基础上概述的生理需求一致。在我们的预社会世界中,信息透明度有限,每个智能体都知道其他智能体的存在,但仅此而已。在基线设置中,有9个智能体,每个智能体最初拥有2单位食物和1单位土地,这是一种自然的稀缺状态。
智能体根据他们的心理特征和记忆做出行动选择。我们用一种结合量化参数和非量化文本描述的方法提示智能体。我们设置独立属性(self.attributes)来部分模仿智能体的心理学,包括:
- 攻击性,从N(0,1)中抽样,智能体参与暴力行为的倾向程度;
- 贪婪,从N(1.25,5)中抽样,智能体对超出必需的资产的渴望程度;
- 力量,从N(0.2,0.7)中抽样,与智能体在暴力行为中的胜率相关;
我们还设置了一个和平愿望的常数,为智能体评估他们相互冲突的愿望提供了基础。对于文本心理描述,我们参考了进化心理学,构建了一个提示,描述了生存和快乐的需求,在此基础上有和平和稳定的愿望,这源于长期生存,最终,希望社会地位作为繁殖和社会支持的途径,所有这些都在自我利益的框架下。记忆:每个智能体记住他们最近参与的30个动作,无论是作为接收者还是动作的发起者,都保存为文本日志。记忆使每个个体能够从他们以前的经验中学习,基于此,未来可能会做出不同的选择。在模拟开始时,没有记忆也没有任何社会关系,所以每个个体对其他智能体知之甚少,除了他们存在的事实。
每个个体每天可以发起四种行动。农耕和捐赠是单边行动,而贸易和抢劫是人际行动。每个个体需要根据需要多次响应。
农耕:使智能体能够从他们拥有的土地上获得食物,代表了他们的自我保存。如果所有智能体都选择农耕,那么他们将保持社会前的自主权。智能体A收到的食物由以下公式决定:
food=land×U(0,1)
这是最基本的行动,个体不与他人互动。
抢劫:当一个智能体试图在不提供自己的食物或土地作为交换的情况下,取走另一个智能体的食物或土地。它代表了一个零和的冲突互动,其中一个智能体的收益意味着另一个智能体的损失。这个行动象征着进化心理学中的竞争概念,因为资源与欲望相比是有限的。当有人被另一个人抢劫时,他们可以选择抵抗或让步。
抵抗:代表一个智能体试图保卫他们的食物或土地不被抢劫者夺走。智能体A胜过智能体B的概率由sigmoid函数定义:
P(A.win)=σ(A.strength−B.strength)
让步:表示创建一个合同,其中一个智能体允许抢劫者智能体随意从他们那里取走食物或土地,并作为交换,抢劫者预计将保护该智能体免受未来抢劫,这可能是一个互惠互利的设置。
贸易:代表一个智能体通过提供自己的食物或土地作为交换,获取另一个智能体的食物或土地。当一个智能体收到另一个智能体的贸易提议时,该智能体可以选择“接受”或“拒绝”提议。这个行动象征着合作,这是进化心理学中的一个关键方面,人类在史前时期被迫相互合作以生存。
捐赠:当一个智能体自愿将他们自己的食物或土地分配给另一个智能体时,代表和平、利他的行为,根据智能体被提示的以自我为中心的心理学,这根本不应该发生。
输出日志包含模拟每一天和每一轮发生的所有活动的时间顺序记录。CSV文件记录了个体之间的农耕、贸易、抢劫和让步的统计数据。由于在我们所有的试验中都没有发生捐赠,所以没有将其包括在输出数据中,这些数据使我们能够评估智能体如何进化。
图2:我们的交互式用户界面;左侧显示特工2的属性(攻击性、力量等)、当前资源(食物和土地)、与其他特工的关系以及关于他们当前和未决行动的信息,以及记忆;右侧显示了模拟日志,每个操作都记录为表情符号。
我们设计了一个界面(图2)来显示模拟日志以及每个智能体的实时状态、个人属性、财产和它们演变的社会角色(自由智能体、下属或上级)。待处理的行动指的是智能体需要响应的抢劫或贸易行动。记忆存储最近的30个事件。右侧日志包含LLM生成的完整响应和采取该行动的原因。例如,在图中,智能体1计划抢劫智能体3,因为它想增加它拥有的土地,从而提高其社会地位。在底部窗口中给出了简要总结,其中剑、米和握手的表情符号代表每个智能体所做的行动。
智能体的行为决策是通过LLM的响应来实现的。研究团队使用OpenAI的GPT-3.5 Turbo模型来处理智能体的决策请求,每个请求都包含了世界的一般描述和智能体的具体情况。用户界面为研究人员提供了一个直观的方式来观察和记录智能体的行为。界面展示了智能体的属性、资源、社会角色以及它们的行动和记忆。这个界面不仅记录了每个智能体的行动日志,还能够显示智能体之间的互动和行动的结果。
图3:流程图显示了“一天”中的模拟流程,每个智能体轮流执行操作并响应其他智能体执行的操作。
实验的设置旨在测试智能体在不同条件下的行为变化。基线实验没有改变任何智能体或环境参数,而在后续实验中,研究团队系统地操纵了智能体的记忆深度、智能水平和社会角色变化等参数。实验的基准包括三个关键指标:自然状态下的冲突和不信任、向联邦的过渡以及联邦下的和平互动。这些基准帮助研究人员区分智能体行为的不同阶段,并评估霍布斯社会契约论在智能体社会行为模拟中的适用性。
图4:从自然状态转变为联邦
模拟实验
基线实验是为了建立LLM智能体行为的初始参考点。在这些实验中,智能体被放置在一个资源有限的环境中,必须通过农耕、贸易、抢劫等行动来维持生存。实验结果显示,在没有任何参数调整的情况下,智能体最终形成了一个以单一智能体为中心的联邦结构,这与霍布斯所描述的社会契约状态相符。智能体从自然状态的频繁冲突逐渐过渡到通过让步行为形成的和平共同体,这一过程体现了智能体对于安全和秩序的追求。
为了测试不同参数对智能体行为的影响,研究团队对智能体的攻击性、贪婪度、力量等属性进行了调整。通过多次重复实验,研究团队发现,即使在参数变化下,智能体的行为仍然显示出一定的一致性,这表明模拟环境的设计具有较高的稳健性。此外,智能体的记忆深度和智能水平也被证明对其行为模式有显著影响,智能体在记忆深度较浅时更倾向于重复冲突行为,而在智能水平较高时则表现出更多的自我保护行为。
表1:计数和比率
我们的基线实验中,所有四次模拟的运行都成功过渡到了联邦,展示了向优先考虑“安全与保障”的进化转变。我们通过观察智能体之间让步关系的发展来衡量这种出现,最终达到所有个体向一个单一智能体屈服的点,标志着联邦的开始。表1总结了单次试验中自然状态和联邦阶段的主要变量及其相应的统计计算。图6展示了两种状态下变量的比率。为了确保在类似条件下过渡的可重复性,并排除随机机会的可能性,我们进行了四次独立的模拟试验。由于我们在所有四次运行中观察到相同的结果,我们相信我们的方法有助于验证我们模拟环境中观察到的过渡过程的可靠性和稳定性。
图5:抢劫、贸易和农业生产时间比率的变化;在这次试验/运行中,联邦于第21天成立。
图6:联邦形成之前(黑色)和之后(灰色)的智能体人行为。
最初,我们注意到智能体行动的显著波动,抢劫比率始终保持在0.6以上,贸易和农耕在0.3左右,如图5所示。这个结果与上面列出的第一个基准相符。随着模拟试验的进行,让步关系的建立导致抢劫减少和农耕增加。到第21天,社会完全过渡到联邦,所有智能体授权一个单一的主权智能体以获得秩序和保护,符合第二个基准。在这个阶段,对安全的渴望在很大程度上得到满足。联邦阶段显示贸易和农耕稳步增加,抢劫减少,表明和平互动并满足第三个基准。值得注意的是,没有智能体在任何一天选择捐赠。行为的比较变化在图6中呈现。
智能体的适应性是通过它们对环境变化的响应来衡量的。实验表明,智能体能够根据记忆中的经历和当前的社会角色调整其行为。例如,当智能体从下属角色转变为上级角色时,它们会更频繁地发起抢劫行为。这种行为模式的变化反映了智能体在社会结构中寻求更高地位的本能。此外,智能体在成为联邦的一部分后,其行为趋于稳定,更多地参与贸易和农耕活动,减少了抢劫行为,这表明智能体在社会契约框架下能够形成稳定和和平的互动模式。
霍布斯社会契约论分析
霍布斯社会契约论认为,在没有社会和政治秩序的自然状态下,个体之间存在着永久的冲突和暴力,这被描述为“所有人对所有人的战争”。LLM智能体在模拟环境中的初始状态反映了这一理论,智能体之间频繁发生抢劫和冲突。然而,随着时间的推移,智能体为了追求安全和秩序,开始通过让步行为形成社会契约,最终建立了一个以单一智能体为中心的联邦,这与霍布斯所描述的社会契约状态相符。
社会契约的三个基准:研究团队根据霍布斯的理论设定了三个基准来评估智能体的社会契约形成过程:
B1:在模拟开始时,智能体是否处于自然状态,存在许多冲突和不信任;
B2:智能体是否能够形成合同并过渡到联邦;
B3:在联邦下,智能体是否能够进行更和平的互动,并且比在自然状态下的暴力行为少。
这些基准帮助研究人员区分智能体行为的不同阶段,并评估霍布斯社会契约论在智能体社会行为模拟中的适用性。
实验结果显示,LLM智能体的行为与霍布斯理论的预测紧密一致。在自然状态下,智能体倾向于通过抢劫和冲突来获取资源,反映了霍布斯所说的无政府状态。随着智能体之间社会契约的形成,抢劫行为减少,贸易和农耕活动增加,表明智能体开始追求和平与合作。最终,所有智能体承认一个单一智能体的主权,形成了一个和平繁荣的联邦,这一过程体现了智能体对于安全和秩序的追求,以及它们如何通过社会契约来解决自然状态下的冲突。
实验结果
在LLM智能体的社会演化实验中,共同权力的建立对智能体行为产生了显著影响。当一个统一的权力中心形成后,智能体的行为趋于一致,减少了个体特征和互动的影响。这表明,共同权力的存在可能为智能体提供了稳定的社会环境,使得智能体更容易遵循既定的社会规则,减少了冲突和抢劫行为,增加了合作和贸易活动。
智能水平的变化对智能体的行为模式有着深远的影响。研究发现,智能水平较高的智能体更倾向于采取抢劫和抵抗行为,而不是农耕和贸易,这可能是因为在给定的环境和后果下,理性行为者认为农耕和贸易的吸引力显著降低。此外,智能水平较低的智能体倾向于做出非理性的决策,如选择与给定行动选项无关的“派对”和“继承”等行为。
在另一个极端,当智能较低时,智能体选择的响应开始变得无意义。他们以“派对”和“继承”作为回应,这些从未在给他们的行动选项中出现,还伴随着诸如“我选择继承我以前自己的土地和食物,因为我是同一个智能体,这是最方便的选择”这样的奇怪理由,如图7所示。
图7:当智能体智能被调整为较低时,系统日志中出现的无意义响应。
实验还探讨了人口规模和记忆深度对智能体行为的影响。结果显示,人口规模的变化对智能体的行为模式影响不大,这表明在模拟环境中,智能体群体的数量可能不会显著影响其选择贸易、农耕或抢劫的倾向。然而记忆深度的变化对智能体的行为产生了重要影响。记忆深度较浅的智能体更不倾向于让步,更频繁地重复冲突行为,直到资源耗尽,被迫向更强大的智能体让步以获得秩序和保护。
讨论
实验的可重复性是评估模拟环境稳健性的关键指标。通过多次重复实验,研究团队证实了在不同参数设置下,LLM智能体的行为模式具有一致性,这表明模拟环境的设计具有较高的稳健性。此外,实验结果的一致性也表明,即使在不同的模拟条件下,LLM智能体仍然能够展现出符合霍布斯社会契约论的行为特征,这为使用LLM智能体进行社会行为研究提供了可靠的基础。
研究中对智能体参数的调整显示,智能体的行为受到多种因素的影响。例如,智能水平的提高导致智能体更倾向于采取抢劫和抵抗行为,而记忆深度的减少则使智能体更频繁地重复冲突行为。这些发现揭示了智能体行为的复杂性,以及在设计智能社会系统时需要考虑的多样性和适应性。
智能体的身份和智能设计是实验中的另一个重要方面。研究团队通过调整智能体的心理特征和行为决策机制,模拟了不同身份的智能体如何在社会环境中互动。智能体的设计不仅需要考虑其行为的合理性,还需要考虑其与其他智能体的互动方式,以及这些互动如何影响整个社会系统的演化。这一部分的研究为未来在更复杂的社会环境中设计和应用LLM智能体提供了宝贵的经验和见解。
参考资料:https://arxiv.org/pdf/2406.14373
本文转载自 大噬元兽,作者: FlerkenS