完全去除语言模型！豆包VideoWorld仅靠“看”就能学习知识，为业界首创或激活“视觉市场”丨科股一线拆解

钛媒体：引领未来商业与生活新知 02月11日

完全去除语言模型！豆包VideoWorld仅靠“看”就能学习知识，为业界首创或激活“视觉市场”丨科股一线拆解

VideoWorld通过浏览视频数据，使机器掌握复杂能力，虽属学术项目未用于产品端，但昭示AI自主学习潜力，有望激活市场。其在技术和应用端带来诸多益处，且国产大模型有望构建联合创新之路。

📽️VideoWorld通过浏览视频数据让机器具备复杂能力

🎯该模型目前未应用于产品端，面临一些挑战

💡有望激活‘视觉市场’，使多技术受益并助力应用

🚀国产大模型有望构建联合创新之路

导读：

与Sora、DALL-E、Midjourney等主流多模态模型不同，VideoWorld通过浏览视频数据，就能让机器掌握推理、规划和决策等复杂能力，是业界首创。该模型属于学术研究项目，目前并未应用至产品端，在真实世界环境中的应用也还面临着高质量视频生成和多环境泛化等挑战。纯视觉模型昭示AI脱离人类自主学习潜力，有望激活“视觉市场”，加速推进智能硬件落地。在技术端，VideoWorld或使视频转码、视觉算法、视觉系统、ISP芯片等技术发展受益；在应用端，助力机器人、自动驾驶、AI眼镜等纯视觉场景下的模型训练，还可二次开发、灵活部署加速模型优化。长期来看，国产大模型“算法创新+开源生态”有望构建一条联合创新之路，AI基础模型加快创新，AI应用部署门槛降低以及成本带动应用繁荣，催化推理算力需求快速增长，软件企业合作趋势也将强化。

VideoWorld模型架构概览：左为整体架构，右为潜在动态模型；图片来源：豆包

AI视觉技术可实现对商品盗窃的侦测及客流分析；图片来源：开源证券

全文共1811字，详细解读如下：

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

VideoWorld AI自主学习视觉市场联合创新

相关文章

海洋动力装备联合创新合作协议签约

万华化学：与富乐集团签署战略合作协议

请问下大家，现在AI是否发展到了我交给他一个学习任务，他就会去互联网上找各种资料来学习，学完了之后能把学习结果存储为知识库。然后我可以让他基于学到的知...

3999元联合创新34G1R带鱼屏上市：4K 165Hz屏、15W无线充电底座

华为系首款 MPV 车型谍照曝光：卖点影音、空悬，口号“跟传统 MPV 说 Bye Bye”

别的人形机器人还在蹦跳隆盛科技的人形机器人已经进厂上班

上海洗霸正在联合中科院准备生产固态电池。

东风集团：正与华为联合布局下一代电子电气架构

东风集团：正与华为联合布局下一代电子电气架构

东风集团：正与华为联合布局下一代电子电气架构