引言可控文本生成(ControlledTextGeneration,CTG)是大语言模型(LargeLanguageModels,LLMs)文本生成的一个重要研究领域,旨在创造出符合特定标准或属性的文本。这包括调整文本的情绪倾向、确保内容安全性、或满足具体主题要求等。目前CTG实现的主流方式是结合有监督微调(SupervisedFineTuning,SFT)和人类反馈强化学习(ReinforcementLearningfromHumanFeedback,RLHF)的范式,通过直接改变模型参数以适应特定的输出要求。...