字节跳动正式设立代号为“Seed Edge”的研究项目,专注于比预训练和大模型迭代更长期、更基础的AGI前沿研究。该项目已拟定五大研究方向,包括下一代推理、感知、软硬一体模型设计、下一代范式以及下一代Scaling方向。这些方向旨在探索更高效、更通用的模型推理方法,统一生成和理解表示的方法,以及Transformer+GPU之外的模型设计,并突破现有反向传播和预训练模式的限制,探索多智能体和测试时间训练等新方向,以推动AGI技术的发展。
💡 **下一代推理:** 探索更高效且更通用的方法,以提升模型推理能力,使其能够更快、更准确地进行逻辑推断和问题解决。
👁️🗨️ **下一代感知:** 致力于找到统一生成和理解表示的方法,从而更好地表示和压缩真实世界的信息,构建更强大的“世界模型”,让AI能够像人类一样理解周围的环境。
⚙️ **软硬一体的模型设计:** 不再局限于传统的Transformer+GPU架构,而是从软硬件协同的角度出发,探索新的模型设计,充分发挥下一代硬件的潜力,实现更高效的计算和更强大的性能。
🔄 **下一代范式:** 挑战现有反向传播、Transformer架构以及预训练+对齐的模式,探索更高效的模型结构和学习方法,以突破当前AI发展的瓶颈。
🚀 **下一代Scaling方向:** 不仅仅关注预训练和推理阶段的Scaling Laws,而是探索多智能体和测试时间训练等新方向,以进一步提升模型的性能和适应性。
据晚点LatePost,2024年下半年,市场曾传闻字节跳动正筹建“大模型研究院”。随后,字节回应称:“有加强大模型相关研究的长期计划,但并未决定建立独立机构。”近期,字节跳动 AGI 研究团队终于浮出水面:1月下旬,字节正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的AGI前沿研究,Seed Edge已拟定5大研究方向。
下一代推理:探索更高效且更通用、提升模型推理能力的方法。
下一代感知:找到统一生成和理解表示的方法,表示和压缩真实世界,构建 “世界模型”。
软硬一体的模型设计:从软硬一体出发,探索 Transformer+GPU 之外的模型设计,发挥下一代硬件的能力。
下一代范式:在反向传播、Transformer 架构、预训练 + 对齐的模式之外,探索更高效的模型结构和学习方法。
下一代 Scaling 方向:在预训练和推理阶段的 Scaling Laws 之外,探索 Multi-Agent(多智能体)和 Test-Time Training(测试时间训练,动态调整模型参数)等方向。