中国科技报 05月07日 02:12
[要 闻] 多模态大模型将重塑行业格局
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

百度发布文心大模型4.5Turbo及深度思考模型X1Turbo,展示了多模态大模型在多个领域的创新应用。通过文本、图像和视频的混合训练,模型实现了跨模态理解与生成,提升了学习效率和多模态融合效果。超拟真数字人、文博智能体、非遗武术数字化传承等应用场景,展现了大模型赋能各行业的潜力。这些创新应用不仅提升了效率,也为文化传承提供了新的途径,预示着未来更广阔的创新空间。

🤖超拟真数字人技术是多模态AI技术支持的体现,其通过“剧本”驱动多模协同,实现了语言、声音、形象的协调一致,在直播等领域展现出强大的表现力。

🏛️文博领域中,百度文心大模型与中国文物交流中心合作,推出了首个文博智能体——文夭夭文博智推官,为公众提供文博专业知识的科普讲解和传播推广,旨在通过AI技术赋能文博事业发展。

🥋非遗武术的传承面临挑战,而“非遗武术—百度文心大模型”应用融合了武术技法与算法,通过3D动作建模、AI动态纠错等技术,将非遗武术技术动作数字化,实现动态打分评测和实时反馈指导,创新了非遗武术的传承方式。

🏭在制造业中,多模态大模型可通过视觉检测与自然语言指令结合,实现缺陷自动标注与工艺优化;在金融领域,其可整合财报、舆情与市场数据,提供更精准的风险评估,展现了重塑行业格局的潜力。

    ◎本报记者 吴纯新

    眼神表情、语气动作与台词内容、周边环境可实时调整,情绪转折和肢体行为切换顺畅,直播间里超拟真数字人的表现力甚至超越真人;果农打开AI助手,语音说出想法,一个集合产品展示、线上下单、收款发货功能的定制化应用即在3分钟内生成,实现无代码编程,每个人都可以成为程序员……

    这些是科技日报记者在Create2025百度AI开发者大会上看到的多模态大模型应用场景。

    近日,百度发布文心大模型4.5Turbo及深度思考模型X1Turbo。作为多模态大模型,前者实现了文本、图像和视频的混合训练,大幅提升跨模态学习效率和多模态融合效果,使学习效率提高近2倍,多模态理解效果提升超过30%。

    创新应用赋能多业态

    超拟真数字人的“超能力”从何而来?其惊艳表现的背后是多模态AI技术的强力支持。

    百度首席技术官王海峰所在的团队研制了“剧本”驱动多模协同的超拟真数字人技术,可实现语言、声音、形象的协调一致。

    “打开电脑,拿起手机,让文物讲述它的故事。”当天,中国文物交流中心与百度文心大模型发布首个文博智能体——文夭夭文博智推官,为公众提供国内外博物馆文物、展览、数字化应用等文博专业知识的科普讲解、传播推广。

    如何提高文物展示水平,重塑与激活文物承载的文化内涵和精神价值?AI给出了科技答案,赋予文物新的创造力。

    中国文物交流中心党委副书记、副主任周宇表示,中国文物交流中心与百度文心大模型合作,希望通过AI技术赋能文博事业发展,借助智能体让人们更方便、更快捷、更全面地了解文物背后的历史、故事以及价值。

    通过整合文本、图像、视频等数据,多模态大模型实现了跨模态理解与生成,突破了传统单模态模型的局限性。王海峰表示,未来,大模型的能力和效率将进一步提升,人们可以探索更前瞻、更有想象力的创新应用。

    在大模型赋能下,文物更鲜活,也更吸引人了。百度文心大模型与中国文物交流中心将继续探索AI大模型技术在文博领域的应用,打造多元化、数字化、智能化文博内容新场景,助力文物和文化遗产保护传承。

    非遗传承有了新方式

    非遗武术是五千年中华文明的活态载体,然而其传承传播正遭遇严峻挑战。数据显示,传统武术拳种仅存129种。

    事实上,非遗武术离人们的生活并不遥远,太极拳、形意拳、八卦掌,这些特色拳种早已通过武侠小说、电影、电视等融入生活。如何让更多人学到非遗武术知识,参与非遗武术传承传播?大模型给出了新答案。

    “非遗武术—百度文心大模型”应运而生。该应用基于百度文心大模型,融合上海体育大学武术学院、中国武术博物馆的专业积淀,将武术技法与算法结合,通过3D动作建模、AI动态纠错等技术,把非遗武术技术动作以数字化的形式保存和记录下来。

    例如,练拳时,AI可以捕捉用户动作轨迹,与标准模型智能比对,实现动态打分评测和实时反馈指导;学习时,系统可解析发力原理,提供科学优化建议,让“纸上招式”变为“立体教学”。

    “大模型丰富了非遗武术的教育形式,也创新了非遗武术的传承方式,未来我们将积极打造新场景。”王海峰说。

    未来,多模态大模型将重塑多个行业格局。例如在制造业中,模型可通过视觉检测与自然语言指令结合,实现缺陷自动标注与工艺优化;在金融领域,其可整合财报、舆情与市场数据,提供更精准的风险评估。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

多模态大模型 人工智能 文心大模型 AI应用
相关文章