回答准确率从60%飙至95%！AI知识库救命方案

AI 的浪潮席卷而来，各行各业都在积极探索 AI 的落地应用，无论是为了提升工作效率，还是为了在同事和领导面前展现技术实力，技术先行者们都跃跃欲试。在众多 AI 落地场景中，**知识库（Retrieval Augmented Generation, RAG）**因其技术成熟且能快速发挥 AI 价值的特点，成为企业优先考虑的方案。

什么是 RAG 知识库？

简单来说，RAG 知识库就是让 AI 针对用户提出的特定知识问题，给出准确的回答。其应用场景广泛，例如：

内部员工问答

智能客服

产品文档助手

市面上有许多关于如何搭建 RAG 知识库的技术方案，本文将不赘述具体实现细节。今天，我们重点讨论 RAG 实践中一个最令人头疼的问题：如何设计切片方案才能最大限度地提升问题回答的准确率？ 我将免费分享一个我们团队在实践中探索出的高效技术设计方案，它几乎可以申请专利！

为什么传统知识库方案回答不够准确？

目前主流的知识库切片方案是将帮助文档切分成多个小块，然后将这些小块内容输入给 AI 进行学习，再由 AI 根据学习到的内容回答用户问题。这种方式存在诸多问题，影响回答的准确性：

版本管理难题

跨页知识点割裂

解决方案：告别文档切片，直接存储“问答对”

我们的解决方案颠覆了主流做法：不要直接对文档进行切片，而是将知识库中的内容直接存储为“问答对”！

设想一下，用户使用知识库的方式就是提问。如果我们向量数据库中存储的内容本身就是经过提炼的问答对，AI 在进行语义匹配时将更容易找到相关信息。

这种方案有以下显著优势：

更高的匹配度

避免内容割裂

完美的版本管理

RAG 落地实践中的“坑”与我们的解决方案

尽管问答对切片方案显著提升了问题回复的准确率，但在实际落地 RAG 项目中，我们仍然遇到了一些常见难题。下面将分享这些潜在的“坑”以及我们的具体解决方案：

图片和附件如何保存？

这可能是许多人容易忽视的问题。传统文档切片方案中，图片和附件都随文档一并处理。但当我们转为存储“问答对”时，这些非文本资料应该如何安放呢？

答案非常简单：在存储问答对到向量数据库时，可以利用其备注字段来保存这些图片、附件等资料的链接或标识。

为什么不要直接存到问答对中？

保证回答质量和准确度

方便后期维护

这是一个关键步骤。我们的做法是：

首先，向大语言模型清晰地说明你提供的技术文档内容。然后，指示它根据这些文档内容，为你生成问答对。

不传之秘： 节省 50% 成本的对话优化技巧 在实际操作中，你可能会觉得需要和大语言模型进行多次对话才能完成问答对的生成。然而，我们发现一个技巧可以立省 50% 的成本：如图所示，对话看似进行了两次，但实际上我们只进行了一次对话。这是怎么做到的呢？秘密在于，我们可以伪造与大语言模型的对话历史记录。例如，截图中大语言模型回答的“好的，我将在后续任务参考上述文档。请告诉我你的具体任务”，这其实是我们自己伪造的历史记录。这让大语言模型误以为这是第二次对话，但实际上，这仍是与大模型进行的第一次有效对话，从而避免了重复的上下文传输成本。 注意看大模型回答的 Summary 信息！ 在生成问答对时，我们故意让大模型也创建了 Summary 信息。这个 Summary 非常有用，它能让大模型在最终给用户回复时，更快更好地理解和回答问题，提高响应效率和准确性。

问答对的保存结构

一个问答对我们保存的内容大致如下，涵盖了问答的核心信息以及有助于检索和理解的元数据：