科大讯飞研究院 01月19日
讯飞星火深度推理模型X1正式发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

科大讯飞发布星火深度推理模型X1,及星火4.0 Turbo底座的全面升级,并首发星火语音同传大模型。星火X1在数学能力上表现亮眼,能进行深度思考和推理,并已落地应用。星火4.0 Turbo底座在行业能力、图文能力和长文本能力上均有提升,解决行业痛点。星火语音同传大模型是业界唯一的端到端语音同传大模型,翻译效果流畅。此外,讯飞还推出了混域知识搜索技术,提升信息搜索效率,并对翻译机等产品进行了升级,满足不同场景需求。

🚀星火深度推理模型X1:具备深度思考和推理能力,尤其在数学解题方面表现出色,能清晰展示解题思路,并已在实际场景中落地应用。

💡星火4.0 Turbo底座升级:行业能力大幅提升,图文识别能力更强,能准确处理复杂文档,长文本理解能力也得到优化,减少错误回复,并首发文档问答句子级溯源。

🗣️星火语音同传大模型:业界首个端到端语音同传大模型,模仿人类同传译员思维,实现实时意群理解和切分,翻译效果流畅,在同传模式下优于国外主流大模型的交传效果。

科大讯飞 2025-01-15 19:21 安徽


今天,科大讯飞正式发布星火深度推理模型X1,星火4.0 Turbo底座全面升级,首发星火语音同传大模型。


✅星火深度推理模型X1发布:数学能力亮眼,率先落地真实应用场景。

✅星火4.0 Turbo底座全面升级:行业能力提升,图文能力、长文本能力解决行业刚需更好用。

✅星火语音同传大模型发布:业界唯一端到端语音同传大模型,同传翻译效果丝滑。


讯飞星火深度推理模型X1,是首个基于全国产算力训练的具备深度思考和推理能力的大模型,用更少的算力,实现了业界一流的效果,并率先实现了实际场景落地。



这是一道去年的高考数学题。



输入星火X1之后,星火X1解题思路清晰,还有思考过程。



面对英文竞赛和奥数题,视频中也展现了X1有全面的思考过程。拿捏小学、初中、高中、大学全学段数学,在奥数上表现也不错,交上了一份挺棒的“数学考试成绩单”。



好消息是,这项能力在讯飞星火里就能体验。

欢迎大家进入讯飞星火网页端和app端,搜索“深度推理模型X1”智能体来体验。



我们也在业界率先将深度推理类模型应用到真实场景:


教师助手

前几天,我们邀请了使用过教师助手的数学教研组老师们体验X1,老师们评价很不错,北京八中教了27年数学的李老师表示,X1推理过程和思路更清晰,如果遇到新题目或者考试题,X1经常会带来很大帮助。

讯飞AI学习机

星火X1也可促进讯飞AI学习机对孩子学习的诊断和推荐指导更加精准,更好的对孩子进行因材施教,产品后续将持续升级。

医疗

星火X1的模型策略也取得了初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率达到90%。今年上半年我们将正式发布基于讯飞星火X1的医疗大模型升级版。


如图,为什么讯飞星火底座能力在持续升级?


因为我们听到了不同行业客户落地诉求、用户的真实需要:能不能让大模型支持更长的文本、理解更复杂的图文、减少幻觉?能不能让大模型对行业的理解能力上有更大的提升?


本次讯飞星火4.0 Turbo行业能力提升,在能源、金融、汽车、运营商等场景下,讯飞星火正在持续学习行业知识,目前已有300+智能体应用,成为更懂行业的大模型。



为了让大模型搞定复杂的行业需求,我们在图文、长文本能力上特别提升,实用度拉满。


图文能力提升,“看”懂复杂文档:

大模型在解决行业真实需要时,常遇到以下画面:



手写试卷、学术论文、企业合同等……如此复杂的版面,大模型识别时稍有不留神,就会遗漏关键要素,导致分析不准确。可以说,大模型图文能力基本决定了企业用户能否充分利用大量的高价值数据。


星火可以准确识别



能做到如此效果,背后是星火4.0 Turbo强化了复杂场景的图文识别能力。效率上,新发布的扫描文档解析“极速版本”,对文档的理解速度提升了10倍,对于一份500页的项目文件,加上扫描、识别、解析的时间,只要2分钟就能全部搞定。



长文本能力提升,星火回答更准:

星火4.0 Turbo对长文本的知识回复错误率相对下降了40%,业界首发文档问答句子级溯源,长文本知识融合的能力也更准了,能有效防止模型乱回答。



基于行业、图文、长文本能力,我们首发“混域知识搜索技术”一次提问,就可以拿到综合搜索后的结果,包括个人知识、企业知识、业务系统数据、精品行业数据、互联网信息等,信息搜索的效率会大大提升。


以撰写油气行业的市场报告为例:



首个具有端到端语音同传能力的大模型:星火语音同传大模型今日发布。


同传(同声传译),即不打断讲话者,几乎同步地将内容翻译给听众。


端到端语音同传,是在机器中直接将语音(语言A)翻译成语音(语言B),实现同步翻译效果。


以翻译机用户真实经历为例,我们直接上实测:


?假如你在新西兰旅游,需要翻译当地导游对风景的介绍:



?假如你是行业参展商,在嘈杂的展会向海外客户介绍产品:


同传翻译体验又快又准,是怎么做到的?


实际上,星火语音同传大模型,模仿人类同传译员的思维链路来训练,可以听到声音后进行实时意群理解和切分,结合上下文语境精准选词,并进行碎片化信息的重组。


比如,I went to iFLYTEK for a seminar at 10 o'clock yesterday 这句话的意思是“昨天十点,我去讯飞参加了一场研讨会”。让我们来看看星火语音同传大模型是如何翻译的:

首先对句子进行意群切分:I went to iFLYTEK// for a seminar// at 10 o'clock // yesterday。


这句话机器直译为“我去讯飞,为了一场研讨会,在10点,昨天”


现在有了大模型的生成能力做信息重组,最终就能翻译成“我去了讯飞,去参加一场研讨会,时间是昨天上午十点”

当前国外主流大模型以交传翻译(即交替传译,说话者说完后再翻译)为主,这样可以获得整句的完整信息后再翻译,而我们的星火语音同传大模型在同传模式中,仍然比国外主流大模型的交传效果更好。



上海外国语学院高翻学院的张爱玲院长也表示,期待语音同传大模型未来能够赋能翻译行业工作提效。


此外,日常对话、医疗等专业领域,讯飞全系产品翻译效果也有了提升。讯飞翻译机将会配置耳机、音箱、麦克风,在今年推出商务套装,满足不同商务洽谈场景使用。


对于需要同传的专业合作伙伴,讯飞同传也限量开放了星火语音同传大模型的功能入口,大家可以直接体验测试。



以上就是本次星火升级发布的内容,完整版内容,可观看科大讯飞视频号。另外,科大讯飞研究院公众号也将后续带来星火语音同传大模型的技术解读。


*部分数据来源:来源于外部榜单、系统实际应用以及测试集




阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

科大讯飞 星火大模型 深度推理 语音同传 AI技术
相关文章