今日荐文
Kimi、DeepSeek中门对狙?中外开发者大对比还暗讽OpenAI,DeepSeek新涌现被赞爆!
撤销拜登所做的一切!特朗普明天上任“大洗牌”:绿卡“不卡”硅谷人才、TikTok“开香槟”还太早?
传小红书有人拿50个月年终奖;特朗普发虚拟币,盘中暴涨1250%;TikTok 将暂停服务 | AI周报
一次 App 更新失败直接让 CEO 辞职谢罪,用户怒将数千元产品扔进垃圾堆!
卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?
🚀 字节豆包大模型团队成立“Seed Edge”AGI长期研究团队,探索AGI新方法,并提供宽松的研究环境和算力资源,鼓励挑战颠覆性课题。
🧠 Seed Edge 团队确立五大研究方向,包括推理和感知能力边界、软硬一体模型设计、AI学习范式和scaling方向,旨在推动AGI的突破。
💡 字节持续加码大模型底层研究,通过“Top Seed 人才计划”招募顶尖人才,并打造长期主义研究环境,确保研究的深入和持久性。
🤖 豆包大模型1.5Pro版本在多个测评基准上全球领先,采用高效模型结构,多模态能力全面提升,并具备更强的深度思考能力,且所有模型训练未使用其他模型生成的数据。
🎤 豆包1.5Pro实时语音模型采用Speech2Speech端到端框架,能实现会哭会笑、能说方言会唱歌,表现力实现质的飞跃。
2025-01-23 13:12 辽宁
1 月 23 日,据媒体报道,字节豆包大模型团队已在内部组建 AGI 长期研究团队,代号“Seed Edge”
整理 | 褚杏娟
1 月 23 日,据媒体报道,字节豆包大模型团队已在内部组建 AGI 长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、具有不确定性和大胆的 AGI 研究课题。接近字节的知情人士透露,Seed Edge 的目标是探索 AGI 的新方法,代号名中 Seed 是豆包大模型团队名称,Edge 代表最前沿的 AGI 探索。Seed Edge 鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,实行采用更长周期的考核方式,以保障挑战真正颠覆性的 AGI 课题。同时,Seed Edge 也将得到单独的算力资源保障。
根据披露,Seed Edge 初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代 AI 学习范式、探索下一个 scaling 方向。尽管业界不少团队在讨论是否应对 AI 预训练和基础研究继续投入,字节仍在以前所未有的战略决心加码大模型底层研究,包括提供充分的算力资源、广泛网罗顶尖研究人才,并打造长期主义的研究环境。
去年 5 月,为储备最具潜力的研究人才,豆包大模型团队启动了“Top Seed 人才计划”,以极具竞争力的待遇在全球招募顶尖博士毕业生加入。成立短短数月内,豆包大模型团队 57 篇论文中选 ICLR、CVPR、NeurIPS 等顶会,研究成果包括下载量超百万的开源工作及 GitHub 万星项目。同时,团队与近 20 所高校展开合作,包括与清华 AIR、北大分别成立 AI 方向联合实验室。
就在昨天,字节发布了豆包大模型 1.5Pro 版本,目前,Doubao-1.5-pro 已在豆包 APP 灰度上线,接受海量请求效果出色,同时,开发者也可在火山引擎直接调用 API 。
据介绍,豆包大模型 1.5Pro 在知识 (MMLU_PRO、GPQA)、代码 (McEval、FullStackBench)、推理 (DROP)、中文 (CMMLU、C-Eval) 等多项公开测评基准上成绩全球领先。字节官方强调了新模型的以下特点:
高效模型结构,超低成本
豆包大模型 1.5Pro 使用较小的激活参数进行预训练,训练成本极低,但性能不打折,采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。
凭借字节自研服务器集群方案,灵活支持低成本芯片,硬件成本比行业方案大幅度降低。另外,字节自研网卡和网络协议,显著优化小包通讯效率,算子层计算与通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。
多模态能力全面提升
新版豆包视觉理解模型 Doubao-1.5-vision-pro,视觉理解能力全球领先。详见文末表格。
全新的豆包实时语音模型 Doubao-1.5-realtime-voice-pro,采用 Speech2Speech 端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。
更强的深度思考能力
基于豆包 1.5 基座模型,通过 RL 算法的突破和工程优化,在未使用其他模型数据的情况下,研发豆包深度思考模型。阶段性进展 Doubao-1.5-Pro-AS1-Preview 在 AIME 上已取得了业内领先的成绩。详见文末表格。
扎实不走“捷径”
所有模型训练过程中,未使用任何其他模型生成的数据。 豆包大模型构建自主的数据生产体系,以标注团队与模型 self play 技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。
会议推荐
在 AI 大模型技术如汹涌浪潮席卷软件开发领域的当下,变革与机遇交织,挑战与突破共生。2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,以 “智能融合,引领未来” 为年度主题,汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。现在报名可以享受 8 折优惠,单张门票立省 1360 元,详情可联系票务经理 18514549229 咨询。
今日荐文
Kimi、DeepSeek中门对狙?中外开发者大对比还暗讽OpenAI,DeepSeek新涌现被赞爆!
撤销拜登所做的一切!特朗普明天上任“大洗牌”:绿卡“不卡”硅谷人才、TikTok“开香槟”还太早?
传小红书有人拿50个月年终奖;特朗普发虚拟币,盘中暴涨1250%;TikTok 将暂停服务 | AI周报
一次 App 更新失败直接让 CEO 辞职谢罪,用户怒将数千元产品扔进垃圾堆!
卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?
你也「在看」吗??
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑