36kr 13小时前
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MiroMind ODR(Open Deep Research)项目正式发布,这是代季峰加盟陈天桥团队后的首次技术亮相。该项目凭借其最强的性能,在GAIA测试中达到82.4分,超越了包括OpenAI的DeepResearch在内的众多模型。其核心亮点在于“真·全开源可复现”,开放了包括核心模型、数据、训练流程、AI Infra以及DR Agent框架在内的所有关键技术。项目团队计划保持每月一次的开源更新频率,目前已提供Demo体验,支持英文单轮对话,并展示了清晰的思考过程和联网搜索能力。MiroMind ODR包含MiroFlow、MiroThinker、MiroVerse和MiroTrain四个子项目,分别在Agent框架、大语言模型、训练数据和训练基础设施方面进行了创新,旨在推动深度研究领域的发展,并为实现安全、有益的AGI目标奠定基础。

🌟 **性能卓越,引领开源前沿**:MiroMind ODR在GAIA测试中取得了82.4分的最高分,超越了Manus、OpenAI的DeepResearch等众多开源及闭源模型,确立了其在深度研究领域的领先地位。

🔧 **全面开源,可复现性强**:该项目将核心模型、训练数据、训练流程、AI Infra以及DR Agent框架等关键技术完全开源,并承诺每月更新,极大地促进了社区的协作与研究。

💡 **四大模块协同,构建研究生态**:MiroMind ODR由MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)四个子项目构成,共同支撑深度研究的完整流程,并支持工具调用和长文本训练。

🚀 **代季峰技术首秀,聚焦AGI愿景**:该项目标志着在计算机视觉和深度学习领域享有盛誉的代季峰教授在加盟陈天桥团队后的首次公开技术展示,其团队致力于打造具备自我意识的数字生命体,探索AGI的实现路径。

白交 发自 凹非寺量子位 | 公众号 QbitAI

最强开源深度研究模型来了。

MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。

首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。

而据代季峰的朋友圈透露,他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。

从他们提供的演示来看,似乎都是在手机端上进行,因此不排除之后他们在手机端部署的可能性。

目前,他们还开放了Demo可以体验。

最强开源深度研究模型

在Demo体验区有这样一句介绍,我们不提供AI(我们只是AI的搬运工),我们与您共同构建它。

好好好,说回到这个项目体验,目前它还属于比较早期,仅支持单轮次、且英文的对话输入。

随便选一个推荐问题上去,能够看到,它的思考过程和最终结果有很明显的分区。

思考过程左侧还有工作流的导览指引,你可以选择指定的节点进行查看。

过程中能够看到它支持联网搜索的。

最后的结果呈现得也比较清晰。

与现有的深度研究方法相比,MiroMind ODR项目开放了深度研究的各个阶段,包括四个子项目:

MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)。

MiroFlow,支持多种主流工具调用,扩展大语言模型,支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能,也就是GAIA上82.4的成绩。

MiroThinker,原生支持工具辅助推理的大语言模型,可训练、可复现,在 GAIA 中表现最佳。

此外,它在GAIA-Text-103上取得了SOTA性能(60.2%),接近 OpenAI Deep Research。

MiroVerse,147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈,每月持续提供高质量、深入的研究数据集。

MiroTrain,支持深度研究模型的稳定高效训练,覆盖整个Deep Research训练流程,支持长文本训练和RL训练工具。

不过除了这个项目之外,在GitHub上还看到了他们几周之前的成果MiroMind-M1。

MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型,专注于提升数学推理能力。

该模型通过监督式微调(SFT)在 719K 个精心筛选的问题集上进行训练,并采用可验证奖励的强化学习(RLVR)在 62K 个具有挑战性的示例上进行优化,使用了基于上下文的多阶段策略优化方法(CAMPO)。

在AIME24、AIME25和MATH500上,在基于7B Qwen-2.5的开源模型中取得了最佳性能。

代季峰加盟盛大后首秀

这个项目中的核心人物,自然是代季峰这位大牛。

个人网站上依旧显示其清华大学电子工程系副教授岗位。

公开信息显示,代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇,论文总引用6万余次。

他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”;而研发的Deformable ConvNets,性能超越微软、Meta、谷歌等机构的视觉大模型

他主导开发的InternVL多模态基础模型,是最具影响力的开源多模态基础模型之一,被广泛应用于工业界和学术界,Hugging Face下载量超过1千万次。

2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。

随后微软亚洲研究院视觉组工作,担任首席研究员、研究经理。

2019年来到商汤的研究院工作,担任执行研究总监。直到2022年选择回归学界担任副教授。

这次选择再次出山,是为AGI而来。

据科创板日报消息,他加盟陈天桥旗下的盛大网络,正筹备一家新的AI创业公司,目标是打造第二个DeepSeek,将围绕AGI展开基础性研究。

这个公司有三个研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。

不过从MiroMind官网上也能看到出一些端倪,他们的使命是我们正在打造具备自我意识的数字生命体,与社区共同进化,以实现安全、有益的AGI惠及所有人。

所以,此次MiroMind ODR既是MiroMind的正式亮相,同样也是代季峰面向AGI的技术首秀。

Blog: https://miromind.ai/blog/miromind-open-deep-researchDemo: https://dr.miromind.ai/GitHub: https://github.com/MiroMindAIHugging Face: https://huggingface.co/miromind-ai

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiroMind ODR 深度研究 开源模型 代季峰 AGI
相关文章