PaperAgent 2024年09月05日
一篇大模型可控文本生成技术最新综述
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

全面概述控制大型语言模型文本生成的技术与方法,包括需求、维度、任务、方法分类等内容

🎯可控文本生成需满足预定义控制条件,如主题一致、安全、风格一致等,同时要保持文本质量,确保其流畅、有用且多样化

📚大型语言模型的可控性有多个维度和能力,CTG是与LLM知识能力正交的维度,可利用多种资源将控制条件融入文本生成过程

💻可控文本生成任务分为内容控制和属性控制两大类,内容控制包括结构、词汇等方面,属性控制涵盖安全、情感、风格、主题等

📝可控文本生成方法分为模型驱动和数据驱动,且在训练和推理阶段有不同的具体方法,如重训练、微调、强化学习、提示工程等

2024-08-26 11:31 湖北

全面概述用于控制大型语言模型 (LLM) 中的文本生成的技术和方法,重点是理论基础和实际实现。

大模型可控文本生成(CTG)综述

可控文本生成的需求

可控文本生成(CTG)必须满足两个主要要求:

与大语言模型中的可控生成相关的Web of Science上的出版趋势

大型语言模型(LLMs)的可控性维度和能力维度

可控文本生成的形式化定义

对CTG的定义如下:

可控文本生成任务

对可控文本生成(CTG)的任务进行了分类,主要分为以下两个大类:

    内容控制(Content Control):也称为语言学控制或硬控制,专注于生成文本的具体元素,如文本的结构和词汇。这种类型的控制要求模型根据预定义的规则精确生成文本内容。内容控制包括:

属性控制(Attribute Control):也称为语义控制或软控制,关注文本的抽象语言属性,如情感、风格和主题。这种类型的控制旨在确保生成的文本在更高层次上反映特定的语义特征。属性控制包括:

4.可控文本生成方法分类

干预阶段、控制方法、特定方法和示例方法的分类

可控文本生成(CTG)方法分类:

CTG中条件的注入

可控文本生成(CTG)的方法主要分为两个阶段训练阶段和推理阶段

可控文本生成方法的分类

训练阶段方法

    重训练(Retraining):从头开始训练新模型或对现有模型架构进行根本性修改,以更好地适应特定的控制条件。这通常在现有预训练模型无法满足新要求时采用。

    微调(Fine-Tuning):通过使用专门设计的小型数据集来调整预训练模型,使其更好地符合特定的控制属性,而无需从头开始训练模型。

    强化学习(Reinforcement Learning):使用奖励信号来引导模型输出朝向特定的控制目标。通过迭代优化,模型学习使其输出与这些目标对齐。

推理阶段方法

    提示工程(Prompt Engineering):在推理阶段,通过设计特定的输入提示来直接影响文本生成,而无需对模型参数进行广泛调整。

    潜在空间操作(Latent Space Manipulation):通过调整模型隐藏层中的激活状态来控制生成的文本,允许在不改变模型权重的情况下精确控制文本生成过程。

    解码时干预(Decoding-time Intervention):在解码过程中修改生成输出的概率分布或应用特定规则,以影响单词选择,确保输出与特定控制条件对齐。

具体方法示例

Controllable Text Generation for Large Language Models: A Surveyhttps://arxiv.org/pdf/2408.12599https://github.com/IAAR-Shanghai/CTGSurvey

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

可控文本生成 大型语言模型 内容控制 属性控制 生成方法
相关文章