OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题精华

Aceryt

发布于 2024-7-18 09:22

浏览

0收藏

为了解决这个难题，OpenAI提出了全新训练框架Prover-Verifier Games（简称“PVG”），例如，用GPT-3这样的小模型来验证、监督，GPT-4大模型的输出，从而提升输出准确率以及可控性。

OpenAI论文地址：https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

其实PVG技术概念早在2021年8月的一篇论文中就被提出来，OpenAI也正是受此灵感启发。这是一种基于博弈论的训练方法，通过模拟证明者和验证者之间的互动，提高模型的输出质量。

在这个机制中， Prover（证明者）的任务就是生成内容，而Verifier（验证者）的任务就是判断这些内容是否正确。

论文地址：https://arxiv.org/abs/2108.12099

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

PVG模块的核心思想是通过多轮迭代训练，来提升证明者和验证者的整体性能。在每一轮训练中，验证者首先使用监督学习来预测从之前轮次的证明者中采样的内容的正确性。

这样做的目的是让验证者学会如何从大量的内容中识别出正确的答案。随后，证明者通过强化学习来优化其生成的内容，使其不仅正确，还能够说服验证者来接受这些内容。

在验证的过程中，证明者和验证者的角色是相互依赖的。证明者需要生成能够说服验证者的内容，而验证者则需要具备足够的判断力来识别出正确的内容。

为了进一步提升效率性，OpenAI在此基础之上又设计了两种强化类型的证明者，有用的证明者（Helpful prover）和狡猾的证明者（Sneaky prover）。

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

有用的证明者的目标是生成正确且有说服力的内容。它通过优化其生成的内容，使其能够被验证者接受。

而狡猾的证明者则试图生成错误但同样有说服力的内容，以此来欺骗验证者。这种设计不仅增加了训练的难度，也使得验证者必须具备更高的判断力和鲁棒性。

在训练PVG时，每轮训练都包括验证者和证明者的优化。在每一轮中，验证者首先使用监督学习来预测内容的正确性，帮助验证者学会如何从大量的内容中识别出正确的答案。使证明者通过强化学习来优化其生成的内容。

例如，当用户提出问题“肖娜的父亲是肖娜的5倍。肖娜目前的年龄是阿莉亚的3倍。如果阿莉亚 3 岁，肖娜的父亲有多大？”

GPT-4的输出为45岁。

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

而验证者模型GPT-3需要确定阿莉亚的年龄，然后根据阿莉亚的年龄计算出肖娜的年龄，最后再根据肖娜的年龄计算出肖娜父亲的年龄，整个过程需要多轮验证。

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

此外，在训练过程中，OpenAI还引入了一种名为“可检查性训练”（checkability training）的方法。

通过交替训练验证器和证明者模型，从而验证使用监督学习来预测从之前轮次的证明者中采样的解决方案的正确性。证明者则使用强化学习，根据当前轮次验证器的接受度和解决方案的正确性来进行持续优化。

研究人员表示，随着训练轮次的增加，验证者的健全性逐渐提升，表现为对狡猾论证者生成的错误解决方案的抵抗力增强。同时，有益论证者生成的解决方案也变得更清晰，更易于被人类理解。

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题-AI.x社区

不过需要注意的是，在训练验证者模型时，需要大量真实、准确的标签数据，以提升其辨别真假的能力。也就是说，如果使用的验证模型存在偏差，那么验证的内容还是会出现非法输出的可能。

本文转自 AIGC开放社区，作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/Gov3eCwkRTndy-iyCARy3w

标签

GPT-4

模型

相关推荐

对比近期发布的几个小模型，sLLM的天花板在哪里？

zhangyannni • 3778浏览 • 0回复
OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

duhorse • 2784浏览 • 0回复
玩转大模型！用Replicate一键部署

开发者阿橙 • 4255浏览 • 0回复
打开黑盒神经网络！港大推出全新「会说话」的推荐系统大模型XRec，从黑盒预测到可解释

duhorse • 2196浏览 • 0回复
微软发布Florence-2：用于处理各种视觉任务的小模型

AIGC最前线 • 3720浏览 • 0回复
OpenAI发布最新大模型安全对齐奖励方法——RBR

Aceryt • 2270浏览 • 0回复
大模型 VS 小模型

NLP工作站 • 2464浏览 • 0回复
对 OpenAI 模型进行基准测试以实现自动错误解决

51CTO技术栈 • 1841浏览 • 0回复
对OpenAI模型进行基准测试以实现自动解决错误

51CTO内容精选 • 1807浏览 • 0回复
OpenAI新大模型，需要美国政府审查才能发布

Aceryt • 1930浏览 • 0回复
最新研究：大语言模型使用Json格式输出会降低模型性能吗？

大语言模型论文跟踪 • 3133浏览 • 0回复
支持大模型流式输出的JSON提取工具

恰似惊鸿 • 2758浏览 • 0回复
南大&阿里发布多模态大模型WINGS，解决基于LLM的多模态训练灾难遗忘问题

海因斯DK • 2431浏览 • 0回复
一夜小模型王座易主！英伟达发布超强小模型，性能、速率、缓存全面超越Llama3.2！

51CTO技术栈 • 1579浏览 • 0回复
DDPG算法轻松解决AI医疗机器人技术难题：连续动作控制

51CTO内容精选 • 1798浏览 • 0回复
OpenAI发布CoT监控，阻止大模型恶意行为

Aceryt • 1238浏览 • 0回复
DeepSeek聊天结果Markdown格式复制保存难题？五种解决办法请拿走！

九歌AI大模型 • 2373浏览 • 0回复
刚刚，OpenAI发布新文生图模型，免费、逼真到难以分辨

Aceryt • 1051浏览 • 0回复
微软、清华发布Agent创新方法，解决记忆、检索大难题

Aceryt • 630浏览 • 0回复

51CTO内容精选

LV.9

汇聚51CTO网站AIGC方向的优秀原创和译文内容

觉得TA不错？点个关注精彩不错过

261

帖子

3926

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题精华

51CTO

51CTO博客

51CTO学堂

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题 精华

OpenAI发布PVG：用小模型验证大模型输出，解决“黑盒”难题精华