IT之家 06月06日 11:28
智源研究院发布“悟界”系列大模型,含全球首个原生多模态世界模型 Emu3
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

北京智源人工智能研究院发布了“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”和脑科学多模态通用基础模型“悟界・见微 Brainμ”。Emu3 实现了图像、文本、视频三种模态数据的理解和生成,支持多模态输入、多模态输出的端到端映射。见微 Brainμ 基于 Emu3 架构,整合脑科学相关脑信号,实现多模态脑信号与文本、图像等模态的映射,为跨模态交互提供了技术基座。此外,还发布了具身智能大模型和全原子微观生命模型。

💡 悟界・Emu3 是全球首个原生多模态世界模型,基于自回归框架,通过预测下一个 token 的方式,无需扩散模型或组合方法即可完成文本、图像、视频三种模态数据的理解和生成,实现了图像、文本、视频大一统。

🧠 悟界・见微 Brainμ 是全球首个脑科学多模态通用基础模型,基于 Emu3 的底层架构,将 fMRI、EEG、双光子等神经科学与脑医学相关的脑信号统一 token 化,利用预训练模型多模态对齐的优势,实现多模态脑信号与文本、图像等模态的多向映射。

🤖 智源研究院还发布了具身智能大模型,包括支持 MCP 的跨本体大小脑协作框架悟界・RoboOS 2.0、具身大脑大模型悟界・RoboBrain 2.0,以及全原子微观生命模型悟界・OpenComplex2。

🖼️ Emu3 支持多模态输入、多模态输出的端到端映射,验证了自回归框架在多模态领域的普适性与先进性,为跨模态交互提供了强大的技术基座。

IT之家 6 月 6 日消息,北京智源人工智能研究院今日发布“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。

智源研究院还发布了悟界・具身智能大模型,包括全球首个支持 MCP 的跨本体大小脑协作框架悟界・RoboOS 2.0、具身大脑大模型悟界・RoboBrain 2.0 和全原子微观生命模型悟界・OpenComplex2 也一并发布。

去年 10 月,智源研究院发布了原生多模态世界模型 Emu3。据IT之家此前报道,该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。官方宣称实现图像、文本、视频大一统。Emu3 支持多模态输入、多模态输出的端到端映射,验证了自回归框架在多模态领域的普适性与先进性,为跨模态交互提供了强大的技术基座。

见微 Brainμ 基于 Emu3 底层架构,将 fMRI、EEG、双光子等神经科学与脑医学相关的脑信号统一 token 化,利用预训练模型多模态对齐的优势,可以实现多模态脑信号与文本、图像等模态的多向映射,并实现跨任务、跨模态、跨个体的统一通用建模,以单一模型完成多种神经科学的下游任务。

▲ Emu3 生成的图像

相关阅读:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

悟界 多模态 人工智能 Emu3 Brainμ
相关文章