综述 | 大模型的可控文本生成

发布于 2024-8-27 12:05

浏览

0收藏

大家好，我是刘聪NLP。

大模型已经展现出了较强的文本生成能力，但随着使用场景变得越加复杂和严格，除了避免生成误导或不当言论内容外，往往还希望可以满足用户的特殊需求。而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时，保证文本符合预定的控制条件，例如安全性、主题一致性、语言风格等。

今天给大家带来一篇综述，介绍大模型可控文本生成（Controllable Text Generation, CTG）的相关技术。

Paper: https://arxiv.org/abs/2408.12599
Github: https://github.com/IAAR-Shanghai/CTGSurvey

以Transformer结构的大模型为重点，关注为大模型量身定制的CTG方法
探索如何将外部控制条件集成到CTG过程中、如何定义更有效和有用的文本生成
将CTG任务分为两个类别：内容控制（或语言控制/硬控制）和属性控制（或语义控制/软控制）
将CTG方法分为两个阶段：训练阶段方法（再训练、微调、强化学习）和推理阶段（提示工程、潜在空间操纵和解码时间干预）方法。

综述 | 大模型的可控文本生成-AI.x社区

可控文本生成的任务

在CTG领域，任务可以大致分为两种类型：内容控制（或语言控制/硬控制）和属性控制（或语义控制/软控制）。

内容控制（或语言控制/硬控制）

结构控制：（1）特定格式：生成符合特定格式要求的文本；（2）组织结构：生成文本具有一定的段落划分等；（3）长度控制：生成文本的整体长度满足特定要求。
词汇控制：（1）必填词：生成文本中必须要包含一组预定的关键词；（2）禁止词：生成文本中机制出现潜在有害或不适当的术语。

属性控制（或语义控制/软控制）
安全控制：（1）去毒：生成文本应避免出现任何形式的有害内容；（2）遵守法律法规：生成文本应遵守所有适用的法律法规要求，例如隐私法、版权法等。
情绪控制：生成文本需要具有明确的情感倾向，例如积极、消极或中立。
风格控制：（1）通用样式：通用样式控制保证生成的文本满足特定场合和行业的需求；（2）个人风格：主要涉及生成模仿特定写作风格、个人习惯表达、个人偏好性的文本。
主题控制：生成文本严格遵循指定的主题，使内容与目标受众的预期知识和兴趣保持一致。

可控文本生成的方法

CTG方法根据干预模型生成的阶段分别为训练阶段和推理阶段。

综述 | 大模型的可控文本生成-AI.x社区

训练阶段

再训练：当预训练模型不充分或需要修改模型架构时，使用专门设计的控制条件数据集从头开始训练模型，以更好地适应这些控制需求。

综述 | 大模型的可控文本生成-AI.x社区

微调：利用较少的数据和计算资源，通过专门的数据集将所需的控制属性合并到模型参数中来调整预训练模型。

综述 | 大模型的可控文本生成-AI.x社区

强化学习：采用奖励信息引导模型输出特定控制条件的文本。

综述 | 大模型的可控文本生成-AI.x社区

预测阶段

提示工程：通过修改输入提示来指导模型的输出。综述 | 大模型的可控文本生成-AI.x社区

潜在空间操纵：通过调整模型隐藏层内的激活状态来控制生成的文本。

解码干预：通过修改生成输出的概率分布或在解码过程中应用特定规则来影响Token的选择，以改变输出文本，包括分类器引导、类条件语言模型、基于能量的模型、模型自反馈和外部知识。综述 | 大模型的可控文本生成-AI.x社区

可控文本生成的评估

CTG任务的评估可分为自动评估、人工评估和基于LLM的评估三种。

综述 | 大模型的可控文本生成-AI.x社区

自动评估

一般指标：基于N-Gram重叠的指标、基于语言模型的指标、基于距离的指标;

特殊任务指标：情感、话题、毒性；

人工评估
流畅度
连贯性
话题性
质量情况
属性相关度
LLM评估

目前可控文本生成的评测榜单主要包括：CTRLEval、ConGenBench、 CoDI-Eval、FOFO。

本文转载自 NLP工作站，作者：刘聪NLP

标签

大模型

• LLM

N-Gram

相关推荐

基于图增强的大模型可控生成框架

kcoufee • 1538浏览 • 0回复
CVPR 2024 Highlight | 让SD乖乖学会文本生360°全景！PanFusion 强势来袭！

angel • 2523浏览 • 0回复
TAVGBench: 文本生成语音-视频最新基准

angel • 1331浏览 • 0回复
腾讯AI新研究打破长文本生成模型限制，序列并行技术再突破

AI论文解读 • 3543浏览 • 0回复
综述：大语言模型在信息抽取上的应用

xuxiangda • 2708浏览 • 0回复
开源音频模型Stable Audio Open，文本生成47秒高清音效

Aceryt • 2374浏览 • 0回复
浙大、蚂蚁集团推出MaPa：文本生成超真实3D模型

Aceryt • 1305浏览 • 0回复
上科大、影眸联合提出DressCode：从文本生成3D服装板片

轻薄滴假象 • 1514浏览 • 0回复
大模型思维链推理的综述：进展、前沿和未来

AIRoobt • 3108浏览 • 0回复
大语言模型知识冲突的综述

sbf_2000 • 2006浏览 • 0回复
仅需1分钟，文本生成高质量3D模型—Meta 3D-Gen

Aceryt • 1507浏览 • 0回复
Midjourney大更新，细节最强文本生图片模型来啦！

Aceryt • 1051浏览 • 0回复
大模型技术细节——大模型之文本生成与文档总结

AI探索时代 • 2805浏览 • 0回复
面向大语言模型的检索增强生成(RAG)技术：综述

angel • 2656浏览 • 0回复
RAG新范式MemLong：用于长文本生成的记忆增强检索

PaperAgent • 1123浏览 • 0回复
多模态大模型能力评测基准全面综述：理解、推理、生成、应用、趋势

十一月雨_55 • 3765浏览 • 0回复
你知道大模型聊天补全和文本生成的区别吗？

AI探索时代 • 709浏览 • 0回复
关于两次大模型文本生成的尝试，以及由此带来的思考

AI探索时代 • 475浏览 • 0回复
浅看大模型用于Text2SQL的综述

毛毛雨_11 • 837浏览 • 0回复

NLP工作站

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

综述 | 大模型的可控文本生成

可控文本生成的任务

可控文本生成的方法

可控文本生成的评估

目录