PaperAgent 2024年07月07日
一篇OpenAI、微软等系统性Prompt技术报告
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

这份报告对生成式人工智能(GenAI)系统中的提示技术进行了系统性的调查和分类,涵盖了文本、多语言、多模态和Agents等领域的提示技术。报告还提供了33个提示相关的词汇表、58种文本提示技术的分类、40种其他模态的技术、4大类Agents提示技术,以及一些评估和框架。

😄 **提示技术的概述:** 报告介绍了生成式人工智能(GenAI)系统中提示技术的广泛应用,并强调了通过提示与这些系统进行交互的重要性。报告还提供了33个提示相关的词汇表,并对提示的不同组成部分进行了定义和讨论。

🤖 **文本基础提示技术:** 报告详细介绍了58种不同的文本基础提示技术,并将其分为六大类别,包括情境学习、零样本提示、思维生成、分解、集成和自我批评。这些技术涵盖了不同类型的提示策略,例如使用示例、提供指令、引导模型进行推理等。

🖼️ **多语言和多模态提示技术:** 报告探讨了超越英语文本提示的领域,主要关注多语言和多模态提示技术。它介绍了18种多语言提示技术和5大类多模态提示技术,包括图像提示、音频提示、视频提示、分割提示和3D提示。这些技术为GenAI系统在处理不同语言和模态的数据方面提供了新的可能性。

🤝 **Agents提示技术:** 报告探讨了提示技术的扩展:Agents与Evaluation。这些扩展使得生成式人工智能(GenAI)系统更加强大和灵活。报告介绍了4大类Agents,包括工具使用智能体、代码生成智能体、基于观察的智能体和检索增强生成智能体。这些智能体能够使用外部工具、生成代码、与环境交互以及检索信息来解决更复杂的任务。

📊 **评估框架:** 报告还讨论了评估GenAI系统性能的框架,包括提示技术、输出格式、评估框架和其他方法论设计决策。这些框架为评估GenAI系统的性能提供了结构化的方式,并帮助研究人员和开发者更好地理解和改进这些系统。

💡 **提示技术的未来:** 这份报告为理解和应用提示技术提供了全面的框架,并为该领域未来的发展提供了宝贵的参考。随着生成式人工智能的不断发展,提示技术将继续发挥重要作用,推动GenAI系统在各种领域的应用。

🚀 **总结:** 这份报告为理解和应用提示技术提供了全面的框架,并为该领域未来的发展提供了宝贵的参考。随着生成式人工智能的不断发展,提示技术将继续发挥重要作用,推动GenAI系统在各种领域的应用。

2024-07-07 00:01 湖北

最近由马里兰大学、OpenAI、斯坦福大学、微软等12个机构联合发布了一份长达76页的Prompt技术报告对生成式人工智能(GenAI)系统中的提示技术(Prompting Techniques)进行了系统性的调查和分类,提供了33个提示相关的词汇表、58种文本提示技术的分类、40种其他模态的技术、4大类Agents提示技术。

1. 引言

介绍了生成式人工智能(GenAI)系统在不同领域的广泛应用,并强调了通过提示(Prompting)或提示工程(Prompt engineering)与这些系统进行交互的重要性以及一些基础性概念知识。

提示的术语:33个术语的全面词汇表

    GenAI系统的部署:基于Transformer的大型语言模型(LLMs)被广泛应用于面向消费者、内部使用和研究环境中。

    提示的构成:Prompt的常见组成部分,包括指令、示例、输出格式化、角色和附加信息。

    提示的作用:用户通过提供输入提示来与这些模型交互,模型根据提示生成相应的输出。提示可以是文本形式,也可以是图像、音频、视频或其他媒体形式。

    提示工程的重要性:了解如何有效地构建、评估和执行提示任务对于使用这些模型至关重要。更好的提示可以提高模型在各种任务上的性能。

    提示领域的挑战:尽管提示是一个广泛研究的概念,但由于该领域的新兴性,关于提示构成的术语使用混乱,缺乏统一的本体理解。

    研究范围和目标:论文的目标是创建一个包含提示技术术语和方法的资源库,以促进该领域的理解和发展。研究范围限定在离散前缀提示,不包括基于梯度更新的技术(如微调)。

    系统性回顾:基于PRISMA流程的进行系统性文献回顾,以识别和分类不同的文本基础提示技术。

    术语和定义:论文提供了一个包含33个术语的全面词汇表,并对提示的不同组成部分进行了定义和讨论。

在提示领域内的类别是相互连接的。讨论了7个核心类别,这些类别在研究范围内的论文中有详细的描述。


2. Prompting元分析

对现有文献中提示技术(prompting techniques)的全面审视和分类,采用了基于PRISMA流程的系统性回顾方法,以收集和分析与提示技术相关的文献。

PRISMA评审流程。累积了4,247条独特的记录,从中提取了1,565条相关记录。

    文本基础提示技术:详细介绍了58种不同的文本基础提示技术,并将其分为六大类别,包括:

提示技术的使用:分析了在研究和行业中常用的提示技术,并讨论了它们在不同模型和数据集上的基准测试。

提示工程:探讨了自动优化提示的技术,包括元提示(Meta Prompting)、自动提示工程(Automatic Prompt Engineering)等。

答案工程:讨论了从大型语言模型(LLM)输出中提取精确答案的过程,包括答案形状、答案空间和答案提取器的设计决策。

58种不同的文本基础提示技术

在设计少量样本提示时强调六个主要的设计决策。*请注意,这里的建议并不适用于所有任务;在某些情况下,每一项都可能损害性能。

提示技术的引用次数。 数据集中的前25篇论文,按它们在数据集中被其他论文引用的频率来衡量。这里的大多数论文是关于提示技术*的,其余的论文包含了提示建议。


3. 多语言和多模态提示技术

探讨了超越英语文本提示(prompting)的领域,主要关注多语言(multilingual)和多模态(multimodal)提示技术。

3.1 Multilingual (多语言)

18种多语言提示技术

3.2 Multimodal (多模态)

5大类多模态提示技术


4. Agents提示技术

探讨了提示技术(prompting techniques)的扩展:Agents与Evaluation,这些扩展使得生成式人工智能(GenAI)系统更加强大和灵活。

4.1 Evaluation(评估)

大型语言模型(LLMs)提取信息、进行推理以及理解用户意图的潜力使它们成为强大的评估者候选。例如,可以提示LLM根据提示中定义的一些指标来评估一篇文章的质量,甚至是先前LLM输出的质量。构建强大评估者的四个重要组成部分:提示技术、评估的输出格式、评估流程的框架,以及其他一些方法论设计决策。

Evaluation四大组成部分

4.2 Agents(智能体)

4大类Agents

https://arxiv.org/abs/2406.06608The Prompt Report: A Systematic Survey of Prompting Techniques

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。



Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

生成式人工智能 提示技术 文本提示 多语言提示 多模态提示 Agents提示 评估框架
相关文章