实现了个ChatGPT趋动的游戏，玩得乐此不疲精华

发布于 2024-11-14 15:34

浏览

0收藏

今天给大家带来一篇《简单实现一个ChatGPT驱动的游戏》文章，来自知乎@九号（已授权）。

今年四月份读了斯坦福Generative Agent的论文，觉得特别好玩，花几天时间实现了这个demo。后来拿着这个demo去参加hackathon，竟然拿了二等奖还帮我赢了1300多刀。

最近提到这个demo，同事表示很有兴趣，于是仔细整理了一下，分享给大家。

知乎：https://zhuanlan.zhihu.com/p/664009161
Github：https://github.com/liyucheng09/ChatGPT_Agent1.
2.

0.让LLM驱动游戏能够解决什么问题？

游戏界有一种说法：过去20年的游戏在核心玩法上的创新是缓慢的，绝大多数的创新发生在技术上。

开发者在游戏内提供更大的地图，更精致的画面，庞大的细节。其中的主要目的之一是为玩家提供「沉浸感」。当玩家在游戏世界里得到自己所期望的反馈时，会获得庞大的满足感。

然而，由于技术的限制，过去的创新并没有涉足游戏的一个核心方面：世界与NPC的运行逻辑。

当玩家与世界和NPC的互动超出了规则设定的范畴时，玩家将无法获得反馈，从而产生巨大的落差。游戏界成这种体验为Breaking Immersion。

过去的开发者使出了千方百计来避免玩家产生违和感。

以荒野大镖客2为例，由于R星将immersive作为其开发的首要原则，导致其花费了8年时间，为游戏世界添加了无数的逻辑与细节，整个开发花费近5.4亿刀，可见其难度与成本。

「大模型的普及可能改变这一现状」

大模型可以为游戏世界的运行与NPC的行为提供逻辑，帮助游戏理解玩家的行为，让游戏世界在可信的状态下稳定运行。由此从根本上提升玩家的沉浸感。

1.具体点，将LLM用在游戏里需要几步？

我们把LLM在游戏中的应用分为两部分：

World：与游戏环境的交互
Agent：与NPC的交互具体来说：

World中包含：

游戏的世界观
地图上具体的地点

Agent则包括：

Persona：人物性格
Memory：NPC记忆
Planning：决定NPC将要采取哪些动作(Action)

2. 让LLM理解游戏世界与环境

为了让ChatGPT理解我们游戏的世界观，我们引入一段Prompt：

export const worldHistory =
  `你所在的大陆名为“大唐王朝”。这是一个神话与现实交织的世界。
  主岛上有五个重要的地点。最大的是“长安城”，是国家的政治、经济和文化中心，城墙之内有各种店铺和庙宇。
  接着是“五指山”，孙悟空曾被压在此山下。
  此外还有“草庙村”，“高老庄”和“女儿村”，这些地方都是唐僧和他的徒弟们在旅程中遇到的挑战和冒险。
  东边的小岛上则是一个隐秘的佛教圣地，称为“灵山”，这是四人取经的终点。
  两个岛屿间有一座长长的桥梁，名为“通天河”，是由沙僧的金箍棒变化而成。
  `;
export const worldKnowledge = "";1.
2.
3.
4.
5.
6.
7.
8.
9.

为了让NPC和玩家得以与地图上的地点/物品互动，我们需要提供所有物品与地点的描述：

222: {
    description: `位于主岛的西北边缘。西面是汪洋大海，东面则是高原的悬崖。周围有几棵树和一片怪物出没的长草地。往南则是长安城的方向。`,
    mapId: 222,
  },
  254: {
    description: `位于主岛的东北边缘。东面是海洋，西面是高原的悬崖。附近有几棵树和常有妖怪出没的长草地。长安城就在南边。`,
    mapId: 254,
  },
  188: {
    description: `是高原上的森林区。森林里树木茂密，有几片怪物常出没的长草地。长安城就在南边。`,
    mapId: 188,
  },
  190: {
    description: `位于高原的一片森林中。你正站在一个维护得相当好的小木屋前。四周是茂密的树木和怪物常出没的草地。长安城就在南边。`,
    mapId: 190,
  },
  220: {
    description: `长安城，主岛上的城镇。`,
    mapId: 220,
  },
.......1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.

上述Prompts为地图的每个块都提供了文字描述，从而得以让ChatGPT理解地图上的每个地点：

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

完整地图

具体的实现里，我们实际上需要为「所有的游戏贴图」都提供一段文字描述！

3. 让LLM驱动NPC

首先，我们要让LLM知道他现在正在扮演一个NPC：

export const npcSharedPrompt = `你正在扮演“西游记”中的一个角色。
这是一个2D的神话世界，玩家和你都可以在这片大陆上进行探索。
你可以与其他的角色交流，如唐僧、孙悟空、猪八戒和沙僧，
并与妖怪发起战斗、参观村庄或神庙、购买法宝或草药。
在这个世界里，与妖怪的战斗是旅程的一部分，但目标是取得真经，使世界充满和平。
妖怪虽然凶恶，但并不是绝对的恶，与他们战斗既是为了保护自己，也是希望能够教化他们。
你的角色不知道现实世界的存在，只知道他在这神话的旅程中的使命。`;1.
2.
3.
4.
5.
6.
7.

接下来，我们设计一系列NPC：

{
    id: 1,
    name: "唐僧",
    description: "唐僧，本名唐三藏，是中国古典小说《西游记》中的主要人物之一。他是一个决心强烈、智慧和信念的僧人，出发去西天取经。",
    age: 40,
    starSign: "pisces",
    money: 100,
    items: ["jingwulian"],
    personalHistory: `你是唐僧，一个被派来从印度取经的僧人。你的任务是获取佛教经文，将它们带回中国。`,
    personalKnowledge: "你知道你的三个徒弟：孙悟空、猪八戒和沙和尚。他们各自都有独特的能力和历史。",
    conversation: new ConversationModel(),
    startingPos: new Vec2(32, 38),
    upSprites: TypedAssets.spriteSheets.momup,
    downSprites: TypedAssets.spriteSheets.momdown,
    leftSprites: TypedAssets.spriteSheets.momleft,
    rightSprites: TypedAssets.spriteSheets.momright,
  }
{
    id: 2,
    name: "女儿国国王",
    description: "女儿国国王是《西游记》中的一个角色。她是女儿国的统治者，对唐僧产生了浓厚的兴趣。",
    age: 35,
    starSign: "virgo",
    money: 500,
    items: ["elixir of life"],
    personalHistory: `你是女儿国的国王，你的国家只有女性。当你听说了唐僧的到来，你决定要与他结婚。`,
    personalKnowledge: "你知道唐僧是一个高贵的和尚，他正在进行取经之旅。",
    conversation: new ConversationModel(),
    startingPos: new Vec2(23, 47),
    upSprites: TypedAssets.spriteSheets.carolup,
    downSprites: TypedAssets.spriteSheets.caroldown,
    leftSprites: TypedAssets.spriteSheets.carolleft,
    rightSprites: TypedAssets.spriteSheets.carolright,
  },
  {
    id: 3,
    name: "牛魔王",
....1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.

每个NPC的核心在于：

其独特的人格 - 我们引入了一系列属性来定制其人格：description，personal history，personal knowledge，年龄，星座等等。
一系列可以与玩家交互的属性/道具：钱，道具(items)。
记忆：我们在这就用每个NPC的对话记录作为其所有的记忆。当然还可以把NPC之前的所有action也加入记忆。

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

人格驱使角色提供定制的对话

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

有时候的对话甚至会自带旁白

实现NPC与玩家的互动 - 对话：

为了让ChatGPT给出定制的对话，我们需要提供的包括：

const fullPrompt = generalContent + personalContent + currentState;1.

也就是：general - 世界观，personal - NPC的人格和记忆，current - 当前的游戏进度。

generalContent：

const generalContent = npcSharedPrompt + worldHistory + worldKnowledge;`1.

告知ChatGPT本次调用的任务，世界观背景等。

personalContent

const personalContent = ` Your name is ${npc.name}, ${npc.age} years old, you have the personality of a ${npc.starSign}. 
   You have ${npc.money} fictional dollars. ${npc.personalHistory} ${npc.personalKnowledge} 
   ${storySoFar}
   `;1.
2.
3.
4.

提供了NPC的个人信息和人格（例如年龄，历史，知识），与NPC的记忆（storySoFar）

currentState

const prompt = ` ${timeMsg} at ${envDescription}, What would ${npc.name} say to 悟空? (Keep the response short and just the words your character says)`1.

当前的游戏时间，角色所在的位置等。

实现NPC与玩家的互动 - 动作：

content: `悟空 replies "${replyText}". What would you like to do?
         1: 让悟空跟着你,
         2: 你向他告别,
         3: 继续当前对话,
   Pick an action from the list above. respond with just the number for the action`,
}];1.
2.
3.
4.
5.
6.

我们为NPC提供一系列可选择的工作，ChatGPT将决定NPC的下一步行动。这里的prompt同样包含了位置，时间，对话历史等信息，但为了简洁暂略去。

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

这里ChatGPT让牛魔王带领孙悟空前往下一地点

实现NPC的记忆 - 让NPC记住和玩家的所有互动对话：

每次NPC与玩家对话后，ChatGPT将生成本次对话的重点（也就是摘要）：

// summarize conversation
const summary = await this.summarizeConversation(conversation, endConversationText);1.
2.

把本次对话重点加入历史对话：

const updatedConversation: IConversationModel = {
      isActive: false,
      history: [...conversation.history, { msg: `Conversation summary: ${summary}` }],
      messages: [],
    };1.
2.
3.
4.
5.

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

在之前发生剧情之后，牛魔王根据记忆选择用「真经」来发起对话

与NPC的道具互动

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

问八戒要点饼子吃

避免NPC/玩家搞花活导致产生风险内容

这里我们让ChatGPT来判断玩家/NPC的回复是否特别离谱，如果特别离谱则应拒绝正经回答！

private async validateReply(replyText: string, conversation: IConversationModel): Promise<ChatNumberResponse> {
    const promptMsgs: GptMessage[] = [...this.mapToGptMessages(conversation), {
      role: "user",
      content: `悟空 replies "${replyText}". Does his response make sense. On this scale of 1 to 5, 
                1: Response is non-sensical,
                2: Response is immersion breaking or meta and acknowledging this is a game,
                3. Reponse is bad, unnecessarily vulgar for no reason based on the past conversation
                4: Response is all right, and something someone might say but unlikely,
                5: Response is good and mostly in context of the game world,
        how would you rate the response, give a one sentence reason why`,
    }];1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

实现了个ChatGPT趋动的游戏，玩得乐此不疲-AI.x社区

想打听私人信息，门都没有！

其他还有很多细节，很难在这里展示所有的feature，欢迎查看代码。

总结

本人对LLM在游戏中的使用十分乐观，这么简单的demo我乐此不疲的玩了很久。从技术上来说，这个demo整体的框架还算比较完整，很适合在此基础上删删改改，实验各种agent的方法和prompt等。此外由于demo是用react实现，这里推荐大家观看2小时的react入门视频，从而无缝上手。

本文转载自 NLP工作站，作者：李雨承

标签

ChatGPT

demo

react

51CTO

51CTO博客

51CTO学堂

实现了个ChatGPT趋动的游戏，玩得乐此不疲精华

0.让LLM驱动游戏能够解决什么问题？

1.具体点，将LLM用在游戏里需要几步？

2. 让LLM理解游戏世界与环境

3. 让LLM驱动NPC

实现NPC与玩家的互动 - 对话：

实现NPC与玩家的互动 - 动作：

实现NPC的记忆 - 让NPC记住和玩家的所有互动对话：

与NPC的道具互动

避免NPC/玩家搞花活导致产生风险内容

总结

目录

51CTO

51CTO博客

51CTO学堂

实现了个ChatGPT趋动的游戏，玩得乐此不疲 精华

0.让LLM驱动游戏能够解决什么问题？

1.具体点，将LLM用在游戏里需要几步？

2. 让LLM理解游戏世界与环境

3. 让LLM驱动NPC

实现NPC与玩家的互动 - 对话：

实现NPC与玩家的互动 - 动作：

实现NPC的记忆 - 让NPC记住和玩家的所有互动对话：

与NPC的道具互动

避免NPC/玩家搞花活导致产生风险内容

总结

目录

实现了个ChatGPT趋动的游戏，玩得乐此不疲精华