11月25日消息,据外媒报道,斯坦福大学、华盛顿大学与Google DeepMind的研究人员携手开发了一种能够逼真模拟人类行为的AI智能体。
研究团队将详细的访谈记录与先进的GPT-4o模型相结合,构建了这一模拟系统。当用户向智能体提出问题时,系统会加载访谈数据,并促使AI模仿受访者的回答方式。为获取这些宝贵的访谈记录,研究团队对每位受访者进行了长达两小时的深入访谈,并利用OpenAI的Whisper技术将对话内容精准转录成文本。
为了全面评估AI对人类行为的预测能力,研究团队设计了包括《通用社会调查》、大五人格评估以及多个行为经济学实验在内的测试。结果显示,基于访谈数据的AI在预测社会调查问题时,准确率高达85%,远超仅依赖人口统计信息的传统方法。
在五项社会科学实验的对比测试中,AI的表现与人类高度一致,相关系数高达0.98,充分展示了其强大的模拟能力。访谈驱动的AI相较于传统的人口统计法展现出了显著优势,不仅预测更为准确,还能有效减少人口统计类别之间的偏差。
目前,研究团队已将包含这1000个AI模型的数据集公开在GitHub上,并建立了严格的两层访问机制,以确保数据的安全与合规使用。综合性数据对研究人员完全开放,而涉及个别参与者的详细数据则需经过特殊审批方可访问。