DeepSeek-R1模型的发布,性能对标OpenAI-o1正式版且成本更低,有望推动下游更广泛的应用落地和商业化。交互型多模态大模型打破单一模态限制,支持文本、音频、图像、视频等多种模态的组合输入输出,实现实时“类人”的理解和反馈,从而实现无缝人机交流。西部证券认为,交互的升级与性能提高同等重要,多模态大模型有望推动人机交互向更简单的自然语言交互形式发展,其应用场景广泛,包括教育、编程、医疗健康、游戏、情感陪伴等。
🚀DeepSeek-R1发布,性能对齐OpenAI-o1正式版,成本更低,预示着大模型应用落地和商业化迎来新机遇。
🤝交互型多模态大模型支持文本、音频、图像、视频等多种模态的输入输出,实现更自然、更高效的人机交互,是人机交互变革的重要驱动力。
📚西部证券强调,交互是连接人类意图与信息及技术实现的关键,交互型多模态大模型的出现将推动人机交互向更简单的自然语言形式发展,其应用场景包括教育、编程、医疗健康、游戏、情感陪伴等。
💡拓尔思数字经济研究院已完成康养大模型第一版本的训练,加入情感支持、主动问答以及多模态能力,并与虚拟人进行整合,探索大模型在康养领域的应用。
👓虹软科技积极布局视觉大模型+XR相关技术,利用ArcMuse技术引擎生成图片、视频、数字人以及3D内容,为XR眼镜载体提供便捷、优质的内容生成引擎,推动XR技术发展。
近年来国内模型进步显著,2024年Kimi、豆包等模型逐步出圈,并带来用户使用习惯的养成。本次DeepSeek-R1的发布,在性能对齐OpenAI-o1正式版、但成本更低,有望带来下游更为广泛的应用落地和商业化机会。
交互型多模态大模型是指跨越单一模态的限制,支持文本、音频、图像、视频等模态任意组合的输入输出,能做出实时的、“类人”的理解和反馈,可以跟人无缝交流的大模型。西部证券认为,应用是连接人类意图与信息及技术实现的媒介,其本质是交互。在大模型迭代过程中,性能提高固然重要,但交互的升级也同样具有重大价值,交互型多模态大模型的出现有望推动人机交互变革——向更为简单的自然语言交互形式发展。其进一步指出,交互型多模态大模型主要应用场景包括教育、编程、医疗健康、游戏、情感陪伴等。
据财联社主题库显示,相关上市公司中:
拓尔思数字经济研究院及相关研发团队已经完成康养大模型第一版本的训练,加入了情感支持、主动问答以及多模态的能力,正在与虚拟人进行整合。
虹软科技积极布局视觉大模型+XR相关技术,利用ArcMuse技术引擎产生图片、视频、数字人以及3D内容等,为XR眼镜载体提供便捷、优质的内容生成引擎。