深度财经头条 01月21日
字节发布豆包实时语音模型 国内AI应用有望迎井喷式发展
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

豆包即将推出最新的实时语音大模型,并将其应用于豆包App的实时语音通话功能。该模型采用统一建模方式,提升了对话效果和实时交互体验,实现低延时和流畅打断。豆包大模型的日均调用量在7个月内增长超过33倍,展现了其强大的市场潜力。多家上市公司也与豆包大模型展开合作,如海天瑞声提供数据服务,乐鑫科技联合推广其在IoT设备的应用。

🗣️豆包即将发布最新实时语音大模型,并全量上线豆包App实时语音通话功能,部分用户已体验更新后的实时通话界面。

🚀该模型采用面向语音生成和理解的统一建模,突破了传统ASR+LLM+TTS级联方式,大幅提升了对话效果,实现低延时和流畅打断的实时交互体验。

📈豆包大模型日均调用量增长迅猛,从5月的1200亿tokens到12月15日的突破4万亿tokens,7个月内增长超过33倍,体现了其市场潜力。

🤝海天瑞声为字节跳动提供智能语音等数据服务,乐鑫科技与豆包大模型合作推广在IoT设备上的应用,展现了豆包大模型在产业界的广泛影响。


豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。据了解,该传言提及模型即为上述实时语音模型。最新模型通过面向语音生成和理解进行统一建模,区别于此前的ASR+LLM+TTS级联方式,在对话效果上有大幅提升,实时交互上不仅低延时,也能流畅打断。

根据火山引擎2024冬季force原动力大会披露的数据,豆包大模型的日均调用量在高速增长,2024年5月豆包大模型的日均tokens调用量为1200亿,7月增长到5000亿,9月达1.3万亿,截止2024年12月15日已经突破了4万亿,在7个月的时间里增长超过33倍。中信证券表示,豆包大模型表现超预期,体现字节跳动在AI的投入形成正反馈,国内AI产业追赶海外的效果开始体现,国内龙头公司有望加速在AI领域的投入。

据财联社主题库显示,相关上市公司中:

海天瑞声在互动平台回复称,字节跳动一直以来是公司的重要客户,公司为其提供智能语音、计算机视觉以及自然语言等各类数据产品或服务。

乐鑫科技在投资者关系活动上表示,公司联合推广豆包大模型落地在IoT设备的相关应用方案。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

豆包 实时语音大模型 AI 字节跳动 语音交互
相关文章