IT之家 2024年12月23日
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

百川智能发布全链路领域增强金融大模型Baichuan4-Finance,该模型融合了100B+中英文金融知识,并经过多层次质量评估体系筛选,由人民大学财政金融学院专家团队参与定义和评估。在FLAME和FinanceIQ评测中,Baichuan4-Finance均位列榜首,其金融专业能力和场景应用能力均领先GPT-4o。该模型API已在百川智能官网正式上线。测试结果显示,Baichuan4-Finance在银行、保险等多个领域准确率均超95%,整体准确率达93.62%,远超GPT-4o。同时,在核心金融业务场景的可用率达84.15%,在金融数据计算等场景的可用率超90%。

🚀Baichuan4-Finance融合了100B+中英文金融知识,并采用多层次质量评估体系进行筛选,由人民大学财政金融学院金融专家团队全程参与定义和评估,确保了模型的专业性和准确性。

📊在FLAME-Cer评测中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,显著领先于GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。

💡在FLAME-Sce评测中,Baichuan4-Finance在一级核心金融业务场景的整体可用率达84.15%,在金融数据计算、金融知识理论等场景的可用率更是超过90%,展现了强大的场景应用能力。

🥇在国内开源金融评测基准FinanceIQ中,Baichuan4-Finance同样超越了GPT-4o和XuanYuan3-70B,整体准确率达到79.23%,领先GPT-4o近13%,进一步证明了其在金融领域的领先地位。

IT之家 12 月 23 日消息,百川智能今日发布全链路领域增强金融大模型 Baichuan4-Finance,融合 100B + 中英文金融知识,采用多层次质量评估体系进行筛选,由人民大学财政金融学院金融专家团队全程参与定义和评估。

在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内开源金融评测基准 FinancelQ 上,Baichuan4-Finance 均登上榜首,金融专业能力和场景应用能力领先 GPT-4o

Baichuan4-Finance API 现已在百川智能官网正式上线,IT之家附测试成绩如下:

FLAME-Cer 评测结果显示,Baichuan4-Finance 在银行、保险、基金、证券等多个资格认证领域的准确率均突破了 95%,整体准确率 93.62%,大幅领先 GPT-4o 和 XuanYuan3-70B-Chat,超出 GPT-4o 近 20%。

Baichuan4-Finance 在 FLAME-Sce 评测中,一级核心金融业务场景的整体可用率达 84.15%,金融数据计算、金融知识理论等场景的可用率超过 90%。

在国内开源金融评测基准 FinanceIQ 中,Baichuan4-Finance 同样超越了 GPT-4o 和 XuanYuan3-70B,整体准确率达到 79.23%,领先 GPT-4o 近 13%。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Baichuan4-Finance 金融大模型 人工智能 评测基准 百川智能
相关文章