IT之家 01月31日
突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

百度研究院发布EICopilot,一个基于AI智能体的解决方案,利用大型语言模型简化企业知识图谱数据库的信息提取。该工具处理包含数亿节点、数百亿边和数千亿属性的数据集,涵盖国家注册企业、组织和公司信息。EICopilot采用创新的数据预处理流程优化数据库查询,利用向量数据库实时生成搜索空间,实现高效的图谱检索。它还具备强大的推理能力,采用思维链和上下文学习技术,提供更精准的查询响应。实验结果显示,EICopilot在速度和准确性方面均优于基线方法,Full Mask版本执行正确率高达82.14%。

💡EICopilot是百度研究院开发的基于AI智能体的解决方案,旨在简化企业知识图谱数据的搜索、探索和摘要,帮助用户高效获得企业洞察。

🔍EICopilot处理的数据集庞大,包含数亿节点、数百亿边、数千亿属性以及数百万子图,涵盖国家注册企业、组织和公司等信息,数据量巨大。

🤖EICopilot采用基于LLM的聊天机器人形式,创新性地使用数据预处理流程优化数据库查询,并利用向量数据库实时生成搜索空间,实现高效的图谱检索和探索。

🧠EICopilot具备强大的推理能力,使用思维链(CoT)和上下文学习(ICL)等技术,使得查询响应更为精准,提升用户体验。

📊实验结果表明,EICopilot的性能优于基线方法,尤其在速度和准确性方面表现突出,Full Mask版本的执行正确率高达82.14%,证明了其高效性。

IT之家 1 月 31 日消息,百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。

项目背景

知识图谱近来在企业领域得到了广泛应用,涵盖法人、注册资本、股东信息等多维度数据。尽管图谱具有很高的实用性,但由于复杂的文本查询和手动探索限制,阻碍有效提取信息。

EICopilot 简介

EICopilot 由百度研究院开发,是一个基于 AI 智能体的解决方案,可简化存储在知识图谱数据库中的企业数据的搜索、探索和摘要,从而有效地获得有关企业的宝贵见解。

EICopilot 处理的数据集包含数亿节点、数百亿边(edges)、数千亿属性以及数百万子图,涵盖国家注册企业、组织和公司等信息。

研究人员收集真实企业相关查询,构建种子数据集,并使用 Gremlin 语言编写搜索脚本,通过系统标注和增强,形成向量数据库,提高搜索精度。

EICopilot 是一个基于 LLM 的聊天机器人,采用创新的数据预处理流程优化数据库查询,利用向量数据库实时生成搜索空间,实现高效的图谱检索和探索。

EICopilot 还具备强大的推理能力,采用思维链(CoT)和上下文学习(ICL)等技术,提供更精准的查询响应。

EICopilot 性能

研究人员使用百度内部数据平台的数据,构建了包含查询和图数据库查询对的数据集,根据查询的遍历长度,将查询分为简单、中等和复杂三类,并采用语法错误率(SyntaxErrorRate)和执行正确率(Execution Correctness)评估 EICopilot 的性能。

实证结果表明,EICopilot 的性能优于基线方法,尤其在速度和准确性方面。Full Mask 版本的 EICopilot 语法错误率低至 10.00%,执行正确率高达 82.14%。

IT之家附上参考地址

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

EICopilot 知识图谱 大型语言模型 AI智能体 企业数据
相关文章