生成式智能体——来自NPC们的独立宣言-51CTO.COM

游戏里的NPC都见过吧？

不管NPC是干嘛的，有任务的接任务，没任务的尬聊，他们共同的特点就是——翻来覆去就是那几句话。

原因也很简单，这些NPC还不够智能。

换句话说，传统的NPC都是先给他们安排好剧本，安排好话术，该到哪步就说哪句话。

而随着ChatGPT的出现，这些游戏角色的对话可以在只输入关键信息的前提下，自我生成。

这就是斯坦福和谷歌的研究者们在做的事——用人工智能创造出的生成式智能体。

生成式智能体怎么生成？

这玩意儿的机理其实很简单，用一张图就可以简单进行概括。

最左边的Perceive就像是最开始的输入，智能体开始接收各类信息。

而中间的大框框，就是最主要的部分了，这里揭示了生成式智能体是怎么「生成」内容的，并且自发地走到最后一步「Act」。

生成式智能体最主要的特点就是有个Memory Stream，也就是内存流。

就像上面提到的传统npc，他们的行为和言语都是规定好的，没有自由发挥的空间。

而如果想自由发挥，就必须有自己的「库」，这个「库」里有AI记下的日常所见、所听的事物，并加以思考，这样才能进一步「Act」。

AI必须得学习嘛。

而提取记忆、计划、反思的环节，就是AI处理记忆的环节。AI不光能记住每天发生了什么，还能反思这些事件，制定每一天的计划。

同时，由AI的行为所引起的新反馈，他们也会记住，并当成新的素材，继续展开新一轮的处理。

Observation就是每个角色对周遭环境以及人、事的观察，Reflection则是对这些观察到的现象的思考。

然后角色们再根据这些内容生成Plan。

一开始，他们先自己制定出大致的计划，然后慢慢细化。先是制定小时计划，再制定出5-15分钟的短期计划。

并且，角色还会根据周遭环境的变化修改各自的计划。完全模仿人类行为，谁不是一天到头疯狂修改自己的计划的呢。

这样，我们就看到了生成式智能体的魅力。

我们可以看到，完全体的生成式智能体（包含观察、思考、计划三部分）的表现要比缺少任何一种、两种的架构表现好得多。

可爱小人Emoji

在谷歌和斯坦福研究人员设计的场景下，一共有25个小AI人，生活在这么一张地图中。

研究人员一共设置了25个角色，并且给每个角色都设定了姓名和职业等基本信息。

比方说，John Lin是一个药店店员，十分乐于助人。他总是在思考如何让他的客户更方便地拿药。

生活方面，John和他的妻子Mei Lin一起生活，后者是一个大学教授。他们的儿子Eddy Lin正在学习音乐理论。

同时还建立了角色之间初始的关系网，比如John和他邻居的关系，对邻居的看法，以及和药店同事之间的关系，平时爱聊什么等等。

每一个角色都有这么一段预设的文字，初步勾勒出了角色框架，引发后续的交互。

而剩下的部分，就靠AI自己发挥了。

每个角色的行为都会由emoji表示，并且会在系统中用一句话概括。比如某某正在写日记，就会用

来表示。

有一天，Isabella和Tom相遇。他们聊起了有关竞选的话题。

要知道，角色之间能使用完整清晰的自然语言进行交流。并且每个角色都能感知到附近的其他角色，并能根据各自的性格和人物关系来自行决定，是擦肩而过还是开始攀谈。

Isabella：「我还在想我该选谁。但我和Sam Moore聊过竞选的事。你对他是什么看法？」

Tom：「讲实话，我不是很喜欢Sam。我觉得他有点脱离咱们的社区，不会为咱们的利益最大化而考虑。」

而出于试验的目的，研究人员还可以进行干预。不过这种干预不同于传统的输入剧本。而是在一些分支的走向上稍微施加一点力量，余下的部分还是靠AI自己发挥。

而具体到每一天的日常，每一个角色都会有自己的「routine」，这个「routine」是预设的。

以下就是药房小哥John Lin的一天。而至于每天会发生什么新鲜事，就是最有意思的部分了。

最后，再让我们看看情人节这天AI之间发生了什么有趣的互动吧。

在情人节这天，研究人员给了两个角色Isabella和Maria一人一条预设信息，告诉Isabella她要举办一场派对，并告诉Maria她喜欢Klaus。

然后，两个角色就开始自己玩自己的了。

Isabella在地图中溜达，看见人就邀请他们来自己的派对。

这其中就包括Maria。Maria肯定也不会错过这个机会和Klaus相处，于是她找到Klaus，邀请他一同前往Isabella的派对。

Isabella邀请完人也没闲着，去咖啡厅装饰了场地，还请来了Maria帮忙。

上面这张图展现了这些AI相互之间的关系，以及由派对引发的交互。

然后一群人AI就快快乐乐地在下午五点开始派对了。

下面这张图则是详细地展开了这场派对的举办是怎么由AI自发引导的。涉及到了记忆的提取、从对环境的观察中进行的反思，以及决策。

左侧是Isabella观察到的环境内容，比如闲置的冰箱、床、架子、书桌、衣柜等等，然后根据环境和要举办派对的意图，做出了装饰、邀请、设计派对等等决策。

如此一来，整个过程就显得非常饱满了。

科幻照进现实？

以上的场景看似简单好玩，但是越发展越能展现出不一样的力量。

Pete在推特上表示，这个成果未来可以应用在很多方面。

比如说应用在VR世界，有了这种生成式智能体充当npc，想必像西部世界里设想的场景不再会是遥不可及的。

「在西部世界中，每一个NPC都有自己的思想，性格，计划，以及人际关系。甚至，更多的东西都是自主生成的。」

而由谷歌和斯坦福的研究者们做的这个玩意儿，就是个迷你的Q版西部世界。

参考资料：

https://twitter.com/nonmayorpete/status/1645355225157615616 https://www.reddit.com/r/MachineLearning/comments/12hluz1/r_generative_agents_interactive_simulacra_of/