大家好,我是吾鳴。专注于分享提升工作与生活效率的工具,无偿分享AI领域相关的精选报告,持续关注AI的前沿动向。
前面吾鳴介绍了一些扣子(Coze)的基本知识,像扣子是什么,能做什么等的介绍,还有一些常用的工作流知识点的总结以及实操,文章列表如下:
今天吾鳴要基于一个考公注意事项的智能体,给大家讲解一下扣子(Coze)知识库的使用。
为什么需要有知识库? 因为大模型训练的数据是有限的,它只能爬取到公网上的一些公开的数据来做训练,对于一些企业或者是个人的私有数据,它是不懂的。比如公司里面的机密文档、个人的健康报告等。所以需要用到知识库来对大模型的知识做增强,让它能够使用到公司内部的数据来做知识增强回答提问者的问题。
先演示下效果:
知识库创建
- 登录扣子工作空间 -> 资源库 -> +资源 -> 知识库 -> 创建扣子知识库
- 选择知识库类型 -> 输入名称 -> 选择导入类型 -> 创建并导入
- 导入提前整理的考公注意事项的文件
- 分段策略设置,选择"自定义","分段标识符"选择换行,"分段最大长度"填800,"分段重叠度%" 填10。
- “分段标识符”:怎么把文档切分成以段为单位的分隔符,在我们这个例子中是“换行符”,一行一段。“分段最大长度”:一段最多是包含多少个字符,这个选默认的就行“分段重叠度%”:段和段直接字符重复的百分比,主要是影响文档检索的准确度
- 分段预览,可以查看到文档切分是否正确,不正确可对分段策略进行调整或者是手动修改文本。
- 下一步,数据处理,知识库就创建完成了
创建工作流
- 完整流程图
- 开始
- “input”:工作流的输入
- 知识库检索
- Query:引用“开始”节点输入知识来源:选择“扣子知识库”目标知识库:选择我们上面创建的知识库搜索策略:
- 语义:根据输入与文档的语义相关性查找文档,比如马斯克和特斯拉是有语义关系的,但是和草泥马是没有语义关系的。全文:就是文档里面是否包含输入混合:上面两种策略搭配使用
- 大模型
- 为什么需要大模型?因为检索处理的都是一段一段的文本,需要大模型把它们整理成流畅的语言反馈给用户,让用户觉得有人在跟他对话一般。
- 结束
创建智能体
今天先分享到这里,如果觉得文章有用,记得一键三连哟,你们的支持就是我不断输出的动力!!!
案例用到的测试数据,工作流源码等我都已经打包好,感兴趣可以到 吾鳴资源站 中下载。