本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
清华用ChatGPT打造了个「零人工含量」的「游戏公司」,从老板到员工都是AI的那种!
只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。
整个过程走下来,只要七分钟就能完成,成本不到0.3美元(人民币两块多一点)!
图片
这个「公司」被命名为「ChatDev」,顾名思义,就是通过聊天来进行开发。
在「公司」中,十多个聊天机器人分别扮演着不同的角色,串联在一起完成开发工作。
整个过程用ChatGPT就能完成,无需为每个环节专门训练相应的模型。
这个「公司」开发一款游戏的平均时间是409.84秒,最快的甚至不到三分钟,最慢的也不过17分钟。
图片
消耗方面,ChatDev使用的是ChatGPT的API(3.5-turbo),平均每款游戏使用约48.5K个token。
根据这一数据计算,用它来开发游戏,平均每款的成本仅需0.2967美元。
那么,这家「公司」是如何运转的呢?
让AI分工合作
研究团队为这个「公司」设计了一套由ChatGPT串联起的「ChatChain」。
每个bot分别扮演CEO、程序员、设计师等不同角色,涵盖了游戏研发涉及的所有岗位。
为了避免出现失误或幻觉,研发过程中的每一个步骤都由两个bot共同完成。
图片
具体而言,ChatDev在制作游戏时一共需要经历设计-编程-测试-文档这四个大环节。
在设计环节开始之前,人类会提供一个初步的想法,这也是唯一需要人类的地方。
这个想法将由bot扮演的CEO、CTO和CP(roduct)O共同进行分析评估。
CEO会分别与CPO和CTO进行讨论,决定游戏的呈现形式(Web/桌面/移动端…)和使用的编程语言。
图片
此外,设计环节中,每个bot具体扮演的角色,是由两个instructor(也是bot)分配的。
为了提高设计工作的质量,团队还引入了「记忆流」和「自我反思」两种工作机制。
图片
「记忆流」会保存每轮对话的记录,供各个bot随时翻阅,确保思路的连贯性。
「自我反思」机制是在bot们完成了各自的工作但没有达到要求时,生成一个「伪我」,将问题和有关对话向instructor进行反馈。
设计工作结束之后,就进入到了编程环节,包括代码撰写和图形界面设计。
CTO向程序员提出要求和大致思路,然后程序员编写代码。
设计师会生成GUI方案,并调用有关工具生成图像资源,由程序员进行集成。
图片
编程过程同样引入了提升质效的工作机制,具体而言包括「代码管理」和「思维指导」。
代码管理机制可以保存开发工程中的多个版本,以便出现问题时能够进行回滚。
而思维指导机制的两点则是让CTO和程序员「互换角色」,相互了解彼此的想法,当出现问题时能更好解决。
图片
程序编好之后,就要进行测试了。
测试环节分为对代码的审查和实际运行两步,涉及「代码审查员」和「测试工程师」两个角色。
测试过程同样引入了「思维指导」机制,当测试反馈不明确时,程序员和测试工程师会进行角色互换。
图片
测试完成之后,游戏的本体就大功告成了,接下来要做的是撰写文档。
文档主要包括环境说明和用户手册两类。
前者说明了游戏运行所需依赖的环境,由CTO指导程序员完成。
而后者则由是CEO决定包含的内容,交由CPO进行生成。
图片
到此,一款游戏的开发工作就全部结束了。
除了提供开始的想法,整个流程再没有出现过人类的影子。
当然,这个流程中的对话、代码等信息对人类都是可见的,确保了开发的灵活性。
如有需要,也可以进行人工干预,比如替换掉生成的GUI。
图片
以上就是关于ChatDev工作过程的全部介绍。
团队简介
ChatDev由清华大学NLP实验室孙茂松教授指导打造,他的研究方向是研究方向为自然语言理解、中文信息处理等。
该实验室的刘知远副教授是论文的共同通讯作者,他的研究方向为知识图谱与语义计算、 社会计算与计算社会科学。
论文第一作者是清华软件学院毕业的钱忱博士,2016年从北京理工大学保送清华直博,2021年毕业后到腾讯公司担任应用研究员。
One More Thing
ChatDev利用AI扮演的角色,模拟了公司这一社会场景。
不仅是这个「AI游戏公司」,用AI模拟人类社会已经成为了一种研究趋势。
比如我们此前曾经介绍过的「游戏版西部世界」,就用AI操控NPC,在游戏中构建了一个社会。
还有团队利用AI控制角色,在南方公园的背景之下做出了一集电视剧。
图片
你认为AI还能模拟出什么样的环境呢?
论文地址:https://arxiv.org/abs/2307.07924