iFLYTEK 2025-04-21 12:14 北京
作为当前业界唯一的基于全国产算力训练的深度推理大模型,讯飞星火X1全新升级。本次升级有这些关键信息⬇️
✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
✨融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
✨首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持SFT、强化学习两种模型定制优化方案,定制门槛低。
✨三大核心技术创新——大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的高效长稳训练,助力星火X1全面升级。
✨星火X1 API已同步上线讯飞开放平台,面向广大开发者和企业开放服务。
快来看看本次升级的精彩细节吧!
此次星火X1升级,在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。
星火X1准确识别出复杂的数学公式,不仅给出完整解题思路,输出结果也严谨清晰。
✅再来看一道逻辑推理题👇
星火X1全方位思考,给出每一种可能的假设,对所有可能性清晰谨慎地探讨。
✅接下来试试代码题👇
面对复杂的代码需求,星火X1缜密思考,代码生成的准确率up!代码能力up!
✅来考考星火X1的语言理解能力👇
在语言理解方面,星火X1在输出内容、格式等方面更加符合用户指令要求,结果既连贯又准确。
✅星火X1的长思维链能力还支持图像输入👇
星火X1接收到图像后,立刻开始对输入的图像进行关联思考,轻松“拿捏”并给出结果。
无论是数学解题,还是图片理解,升级后的星火X1都能给出严谨、专业、准确的回答,展示完整、清晰的推理过程,让大家更能直观清楚地理解星火X1的思考过程。
星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
以司法行业为例👇
针对司法行业中的专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1关注用户指令需求,详细分析案件争议点,快速定位材料中的关键信息,准确输出内容。
为了让更多企业能够便捷用上AI,本次升级的星火X1为企业AI落地提供了双重支持:
⭐️首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,4张卡(华为910B)即可部署满血版星火X1,私有化部署简便。
⭐️全新升级模型定制优化工具链,支持SFT、强化学习两种模型定制优化方案,16张卡(华为910B)即可完成行业定制优化,定制门槛低。
星火X1此次全新升级,背后有三大技术创新:
1️⃣大规模多阶段强化学习训练方法:提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。
2️⃣基于快慢思考的统一训练方法:提出统一模型下快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用。
3️⃣工程技术系统创新保障基于国产算力的高效长稳训练:实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。
现在,打开讯飞星火网页端或讯飞星火APP,即可体验在通用任务上深度推理和联网搜索的全新效果。
同时,星火X1 API也已同步上线讯飞开放平台,面向广大开发者和企业开放服务。
星火X1作为首个支持全国产算力的推理大模型,目前微调服务已上线讯飞星辰MaaS平台。
现在访问https://xinghuo.xfyun.cn/sparkapi
即刻体验星火X1 API,快来试试吧!
星火X1本次升级后的更多用法,等你探索与分享。