IT之家 04月14日 12:53
字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

字节跳动最新思考模型Seed-Thinking-v1.5技术细节公开,4月17日将通过火山引擎开放接口供用户体验。该模型在多领域表现突出,采用MoE架构,推理成本优势显著,且在数据体系、奖励模型、训练方法和训练框架等方面有诸多优化。

🎯模型在专业领域及通用任务中表现突出,达业界第一梯队水平

💲单位推理成本相比DeepSeek R1降低50%,实现性能与效率平衡

📚融合可验证与创意性数据,优化数据处理策略

🎉提出双轨奖励机制,兼顾不同任务需求

🚀采用‘监督精调 + 强化学习’双阶段优化,优化训练框架

IT之家 4 月 14 日消息,IT之家从豆包大模型团队获悉,字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节今日公开,该模型将于 4 月 17 日通过火山引擎开放接口供用户体验。

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。

模型各方面具体表现:

数据体系:融合可验证与创意性数据

针对推理与生成任务的不同需求,团队优化了数据处理策略:

奖励模型:双轨体系校准训练方向

团队提出双轨奖励机制,兼顾“对错分明”与“见仁见智”任务:

训练方法:“监督精调 + 强化学习”双阶段优化

Seed-Thinking-v1.5 采用“打基础 + 磨能力”的全链路训练:

训练框架:支撑 20B MoE 的底层架构

为应对 20B MoE(总参数 200B)的复杂训练需求,团队优化了底层架构:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Seed-Thinking-v1.5 字节跳动 推理成本 数据体系 奖励模型
相关文章