AWS使用提示词与RAG来减少大模型幻觉

概览

大型语言模型（LLM）是生成内容的强大工具。这些LLM的生成能力伴随着诸多优缺点。我们经常遇到的主要问题之一是生成内容的事实准确性。这些模型具有高度的幻觉倾向，有时会生成不存在或错误的内容。生成的内容往往极具说服力，看起来像是事实正确的有效信息。作为开发者，我们有责任确保系统完美运行并生成简洁的内容。本文将深入探讨在使用AWS Bedrock及其他AWS工具和技术开发应用时，降低幻觉现象的两种主要方法。

AWS OpenSearch：全托管的搜索与日志分析服务
AWS OpenSearch 是亚马逊云科技（AWS）推出的全托管开源搜索和日志分析服务，基于 Apache OpenSearch（原 Elasticsearch 的分支）构建，旨在简化搜索、日志分析、监控和可观察性等场景的实现。其核心优势在于高可用性、弹性扩展、低成本存储以及与 AWS 生态系统的深度集成。

Amazon Titan：AWS 基础模型系列
Amazon Titan 是 AWS 推出的高性能基础模型（Foundation Models, FMs）系列，涵盖文本生成、图像生成、嵌入模型，专为生成式 AI 应用设计，支持企业构建定制化解决方案。

AWS Bedrock 是亚马逊云科技（AWS）推出的一项完全托管的生成式人工智能（AI）平台服务，旨在简化开发者和企业对基础模型（Foundation Models, FMs）的访问与使用。它通过统一的 API 提供来自多个领先 AI 公司（如 Anthropic、Cohere、Meta、Stability AI 等）的高性能模型，并结合 AWS 的基础设施和工具，帮助用户构建安全、高效的生成式 AI 应用程序。

典型应用场景

客户支持
构建 AI 聊天机器人，自动回答用户问题，处理订单查询或索赔流程（如 [6] 中提到的零售订单管理）。
内容生成
生成博客文章、社交媒体内容、广告文案，或根据输入数据创建图像（如 Stability AI 的 SDXL 模型）。
数据分析与洞察
通过模型嵌入和 RAG 技术，从非结构化数据中提取关键信息（如合同分析、会议记录总结）。
自动化工作流
代理可执行代码分析、数据可视化、数学问题求解等复杂任务（如 [3] 中提到的代码解释功能）。

提示工程

系统提示

角色设定：通过系统提示可以为LLM设定角色。这将指导模型扮演指定角色并在特定范围内生成内容。

边界设定：边界设定能指导LLM在限定空间内生成内容。这有助于明确指令分解和精准执行。

安全增强：安全性是任何软件应用的重要方面。系统提示通过在用户输入与LLM之间增加额外保护层，提升了LLM应用的安全性。

清晰的系统提示能帮助LLM将指令分解为步骤并做出相应决策。这将使系统更清晰、简洁和高效。设计系统提示时需要：

确定用例

确定约束和边界

确定呈现要求：

检索增强生成（RAG）

+------------------+       +---------------------+|   原始数据源     | ----> |    定期同步到 S3     |+------------------+ 同步  +----------+----------+                                      |                                      v                     +----------------------------------+                     | 分块处理 & 使用 Titan 嵌入模型   |                     | 将文本转换为向量表示             |                     +--------+---------------------------+                              |                              v                 +-------------------------------+                 | 存储至 AWS OpenSearch         |                 | 向量数据库（知识库）          |                 +-------------------------------+                              ↑                              |               +------------------------------+               |      RAG 库 / 查询引擎        |               | 接收用户查询，执行相似搜索    |               +--------------+---------------+                              |                              v                +-----------------------------+                | 从 OpenSearch 检索相关数据块  |                +--------------+--------------+                               |                               v            +--------------------------------------+            | 用检索结果丰富提示信息（Prompt）      |            +--------------+-----------------------+                           |                           v           +----------------------------------------+           | LLM（大语言模型）生成最终输出           |           | 结合上下文，避免编造或注入错误信息      |           +----------------------------------------+

RAG

结论

该流程有效减少了幻觉现象，生成可溯源的事实信息。此外还尝试了另一种方法：使用LLM作为评判模型，对照金牌数据集评估生成内容的公正性，确保输出质量。

概览

提示工程

检索增强生成（RAG）

结论

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签