一、什么是知识库?
1.概念:
知识库是Coze平台的核心功能之一,它允许开发者或用户上传自己的资料(文档、文本、表格等),并将这些资料转化为 AI 可以理解和使用的知识,从而让 AI 助手(Bot)能够基于这些专属信息回答问题或执行任务。
2.功能概述
知识库功能包含两个能力,一是存储和管理外部数据的能力,二是增强检索的能力。
①数据管理与存储
扣子支持从多种数据源例如本地文档、在线数据、Notion、飞书文档等渠道上传文本和表格数据。上传后,扣子可将知识内容自动切分为一个个内容片段进行存储,同时支持用户自定义内容分片规则,例如通过分段标识符、字符长度等方式进行内容分割。
②增强检索
扣子的知识功能还提供了多种检索方式来对存储的内容片段进行检索,例如使用全文检索通过关键词进行内容片段检索和召回。
大模型会根据召回的内容片段生成最终的回复内容。
二、实际运用
步骤:
能完成这些功能:
1.改变LLM(大型语言模型)的普世知识
可以通过知识库扩展/篡改AI的认知,使他输出的内容达到我们预期设定
例如:2002年的世界杯冠军是巴西,我们可以通过上传知识库,篡改他的输出。
上传知识库前:
上传知识库后:
因为与实际不符所以会出现提示,但若运用到数据的更新,就十分的方便和快捷了。
2.为LLM引入私有知识
比如说可以将个人知识学习与研究笔记植入知识库,来打造专属智能学习助理。
任何 LLM 不知道、不擅长、不准确、不及时、不符合你特定要求的知识,都是需要知识库补充的“私有知识”。
3.让LLM定时获取最新知识
比如伊朗和以色列之间的冲突升级,而模型还停留在2024年,我们就可以定期更新知识库,使其和获取最新知识。
更新前:
更新知识库后:
还可以完成账号密码储存:
资源库>>知识库>>表格
设置好我们的基础内容就可以开始调用智能体测试了。
通过这个功能我们可以通过插入数据库来用智能体准确查找我们想要的数据了!
三、参数介绍和推荐
在工作台知识最右边有一个设置:
按自己的需求来选择:自动调用/按需调用
1.调用方式:
自动调用:Bot 在回答所有问题时自动查询知识库(适合知识密集型场景)。
按需调用:需在 Bot 的 Prompt 中手动指定何时调用知识库(例如:若问题涉及产品参数,请查询知识库)。
2.搜索策略:
混合模式(推荐):同时使用 语义搜索 + 关键词搜索,兼顾相关性与覆盖率。
语义搜索:理解问题含义,检索语义相似的片段(例:问“怎么退款” 匹配 “退货流程说明”)。
全文搜索:基于关键词匹配(例:问“退款政策” 匹配含“退款”“政策”关键词的文本)。
3. 召回参数控制
最大召回数量:
默认值:每次检索返回的文本片段数量(如 5 条),影响后续生成答案的信息量。
最小匹配度:
默认值:设定相关性阈值(如 0.65),低于此值的结果将被过滤,避免无关信息干扰答案。
4. 智能优化模块
表格/SQL 查询:
开启:若知识库含结构化表格(如 Excel),AI 可将自然语言问题转写为 SQL 查询.
查询改写:
开启:AI 自动优化用户问题的表述,提高检索效果(例:用户问“咋退货?”→ 改写为“如何办理退货流程?”)。
配置建议与使用场景
功能 | 推荐设置 | 适用场景 |
---|---|---|
调用方式 | 按需调用 | 通用型 Bot(仅特定问题需查知识库 |
搜索策略 | 混合模式 | 90% 场景的最佳选择 |
最小匹配度 | 0.6~0.7 | 平衡准确性与召回率 |
表格/SQL查询 | 开启 | 知识库含结构化数据(财报、产品参数表等) |
查询改写 | 开启 | 用户提问口语化、不完整时显著提升效果 |
结果重排 | 开启 | 确保答案基于最相关片段生成 |
原文地址:https://www.cnblogs.com/anncan/articles/18937119