原创 小茸茸 2025-03-27 09:24 重庆
Qwen 2.5-Omni-7B: 语音聊天 + 视频聊天;Ideogram 3.0 升级:真实感与创意表现提升
Qwen 2.5-Omni-7B: 语音聊天 + 视频聊天
阿里通义团队发布了 Qwen 2.5-Omni-7B 模型,OpenAI 高级语音模式的开源平替。
这个模型能够无缝处理文本、图像、音频和视频等多种输入形式。
不用客户端,佬们可以在 qwen.ai 上直接语音或视频聊天。该模型同样基于 Apache 2.0 许可开源,完整细节可以看官方博客[1]
Qwen 2.5-Omni-7B 官方技术博客: https://qwenlm.github.io/zh/blog/qwen2.5-omni/
Ideogram 3.0 升级:真实感与创意表现提升
AI 图像生成平台 Ideogram 正式发布了 3.0 版本模型,在真实感、创意表现和图像一致性方面都有提升。
新版本现已在其官网开放使用,所用用户都可以使用,每次消耗 4 个积分。
不过目前官方尚未公布 API 接口和具体定价方案,根据我的经验,这种级别的模型服务估计不会太便宜。感兴趣的佬可以查看官方推文[2]中的详细介绍和示例。
Ideogram 3.0 官方推文: https://x.com/ideogram_ai/status/1904927717281456188
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!