最新文献综述：LLM可控文本生成-51CTO.COM

经过一年多的发展大模型已融入了我们的日常工作中，但是大模型经常会输出一些不符合约束的结果，本文将给出一份详尽的指南，介绍如何管理和指导大型语言模型（LLM）进行文本生成的各类技术和方法，着重于理论支撑与实践操作。

图片

可控文本生成（CTG）需实现两大核心目标：

与大语言模型中的可控生成相关的Web of Science上的出版趋势。

图片

大型语言模型（LLMs）的可控性维度和能力维度。

图片

可控文本生成（CTG）的定义概述如下：

对可控文本生成（CTG）的任务进行了分类，主要分为以下两个大类：

内容控制（Content Control）：也称为语言学控制或硬控制，专注于生成文本的具体元素，如文本的结构和词汇。这种类型的控制要求模型根据预定义的规则精确生成文本内容。内容控制包括：

结构控制：包括特定格式（如诗歌、食谱等）、组织结构（如段落划分、标题使用、列表排列）和长度控制。

词汇控制：确保文本包含预定义的关键词集，以及避免使用可能有害或不适当的术语。

属性控制（Attribute Control）：也称为语义控制或软控制，关注文本的抽象语言属性，如情感、风格和主题。这种类型的控制旨在确保生成的文本在更高层次上反映特定的语义特征。属性控制包括：

安全性控制：包括去除有害内容和遵守法律法规。

情感控制：确保文本表现出明确的情感倾向，如积极、消极或中性。

风格控制：包括通用风格（适应特定场合和行业的专业沟通风格）和个人风格（模仿特定写作风格或根据个人喜好生成个性化文本）。

主题控制：确保文本严格遵守指定的主题。

干预阶段、控制方法、特定方法和示例方法的分类

图片

CTG中条件的注入

图片

可控文本生成（CTG）的方法主要分为两个阶段：训练阶段和推理阶段

可控文本生成方法的分类

图片

提示工程（Prompt Engineering）：在推理阶段，通过设计特定的输入提示来直接影响文本生成，而无需对模型参数进行广泛调整。
潜在空间操作（Latent Space Manipulation）：通过调整模型隐藏层中的激活状态来控制生成的文本，允许在不改变模型权重的情况下精确控制文本生成过程。
解码时干预（Decoding-time Intervention）：在解码过程中修改生成输出的概率分布或应用特定规则，以影响单词选择，确保输出与特定控制条件对齐。

Controllable Text Generation for Large Language Models: A Survey
https://arxiv.org/pdf/2408.12599
https://github.com/IAAR-Shanghai/CTGSurvey1.
2.
3.