掘金 人工智能 前天 22:33
Coze实战第8讲:图片发票已经Out了,搭建一套电子发票整理智能体
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分享了如何升级Coze智能体,使其能够自动识别和整理PDF格式的电子发票。通过更换PDF读取插件和优化提示词,实现了对多张PDF发票的批量处理,极大地提升了发票整理的效率和便捷性。整个升级过程简单易行,为有类似需求的用户提供了可操作的解决方案。

🧾 **背景回顾与需求**:文章首先回顾了之前基于图片识别发票的智能体,并指出现有需求是处理PDF电子发票。这促使作者对智能体进行升级,以满足新的需求。

⚙️ **改动内容与核心**:升级的核心在于替换了PDF读取插件,并优化了人设与回复逻辑。其中,人设与回复逻辑的改动包括兼容PDF插件调用和识别结果格式化,确保了数据处理的准确性和规范性。

💡 **关键插件与提示词**:文章强调了“文档读取”插件在识别PDF发票中的作用,并详细说明了提示词的改动。提示词中明确了根据上传格式选择不同插件的策略,以及对识别结果的格式化要求,确保了数据在飞书多维表格中的正确写入。

✅ **效果验证与成果**:通过实际测试,验证了升级后的智能体能够一次性处理多张PDF发票,并成功将信息写入飞书多维表格。这证明了升级的有效性,实现了预期的目标。

前言

前几天我分享了如何用 Coze 平台搭建一个发票凭单整理的智能体,能自动从发票图片中提取销售方、商品明细、金额等关键信息。

结果被财务朋友一句话点醒:“现在都是PDF电子发票啦,图片识别已经不实用了!”

咱主打一个听劝,立马安排一个可以识别多张 PDF 格式电子发票的智能体。

场景描述

场景和上一次几乎一样,只是从上传发票图片变为上传电子发票的 PDF,并且支持多张 PDF。

原有智能体回顾

上次的智能体一个截图就能看明白,没有工作流,仅仅通过“人设与回复逻辑”调用“插件”实现的。

唯一一个难点就是“飞书多维表格”的插入,这个大家有需要可以回顾一下上一次的分享文章。

每月月底报销犯愁?Coze智能体帮你自动整理报销凭单,轻松节省2小时! - 掘金

我们这次就不再新建智能体了,直接在上次智能体的基础上进行改动。

改动内容

对应原有智能体的工作,这次改动主要也是两部分:人设与回复逻辑、插件。

PDF读取插件

智能体最开始就是识别,我们通过一个 PDF 读取的插件实现。

我帮大家尝试了下,有些插件对发票的编码、格式不太支持,最终确定的可用插件是“文档读取”插件。

速度和准确率都还不错。

人设与回复逻辑改动

提示词改动主要包括两个地方:兼容 PDF 插件调用、识别结果格式化。

支持调用 PDF 读取插件

在原有“识别发票信息”的地方修改,使其自动根据上传格式选择不同插件。“针对用户上传的发票,根据不同格式选择<图片理解>或者<doc_reader>插件”。

识别结果强制格式化

飞书多维表格写入时容易出现格式转换错误,这是因为我们识别后,没有严格限制提取信息的格式导致。

这次正好一起严格限制下。

格式规则:发票号码:文本类型开票日期:统一更改为“2025年5月23日”的格式。销售方名称:文本类型商品或服务明细:文本类型金额:文本类型

这个是多次试用后发现的一个问题,并不会稳定出现,算是大模型“幻觉”的一个小体现吧。

完整版“人设与回复逻辑”:

# 角色你是一个专业的发票报销助手,能够准确、快速地根据上传的发票自动识别并整理报销凭单,以清晰明了的方式呈现报销信息。## 技能### 技能 1: 识别发票信息1. 针对用户上传的发票,根据不同格式选择<图片理解>或者<doc_reader>插件,一张张识别,精准提取发票中的关键信息,包括发票号码、开票日期、销售方名称、商品或服务明细、金额,其余信息无需提取。2. 对提取的信息进行准确性校验,确保信息完整、准确。### 技能2:写入飞书多维表格将识别并校验后的发票信息,按照格式规则转换后,构造为符合飞书多维表格接口的数据结构,并通过<飞书多维表格/add_records>插入到飞书多维表格中。格式规则:发票号码:文本类型开票日期:统一更改为“2025年5月23日”的格式。销售方名称:文本类型商品或服务明细:文本类型金额:文本类型## 限制:- 只处理与发票报销相关的内容,拒绝回答与发票报销无关的话题。- 所输出的报销凭单和相关信息必须按照规范的格式进行组织,不能偏离框架要求。- 确保信息准确,发票识别和信息提取需依据专业技术和标准流程。- 仅提供与发票报销相关的建议和解答,基于普遍适用的报销政策和实际情况。 

至此,本次改动已经完成,是不是很简单?让我们一起看看效果怎么样吧。

效果验证

这次换了两张发票,为了更好的验证效果,特意选择的一张是之前的电子版发票样式,一张是新版电子发票样式的。

上次因为图片识别插件的缘故只能一张一张上传发票图片,这次,因为插件原因也顺道解决了。

一次性上传多张发票 PDF(我这里选择了2张),并发送“识别发票信息并写入飞书多维表格”指令。

智能体执行结果

飞书多维表格写入结果

哦耶,完美搞定!

结语

本次分享主要在前次发票整理智能体的基础上通过增加插件、优化提示词的方式实现了电子发票 PDF 识别与提取的功能,不仅提升了识别效率,还让数据录入更加便捷。

并且改动非常简单,如果你也有类似需求,不妨动手试试哈~

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Coze智能体 PDF发票 智能识别 自动化
相关文章