三花AI 07月08日 14:11
这还是我认识的百度吗?Ernie 4.5开放23款大模型性能比肩OpenAI O1;Qwen-TTS支持3种中文方言7种双语发音
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

百度重磅发布23款开放权重大模型,包括VLM和LLM两大系列,性能优异。所有模型均基于Apache 2.0许可,完全开放商业用途。此次发布的模型参数范围从0.3B到424B不等,覆盖了各种应用场景需求。字节跳动开源XVerse模型,实现了多主体图像生成中身份一致性。阿里通义发布Qwen-TTS语音合成模型,支持3种中文方言+7种双语发音,但目前暂未开源。

🔍 百度开放23款大模型,包括VLM和LLM两大系列,性能优异,参数范围从0.3B到424B不等,覆盖各种应用场景需求。

🎨 字节跳动开源XVerse模型,实现了多主体图像生成中身份一致性,支持高度自定义的姿势、风格和灯光调节。

🗣️ 阿里通义发布Qwen-TTS语音合成模型,支持3种中文方言(北京话、上海话、四川话)和7种双语发音人声,但目前暂未开源。

原创 小茸茸 2025-07-01 09:48 重庆

百度开放23款大模型:Ernie 4.5性能比肩OpenAI O1;字节跳动 XVerse 开源:多主体身份一致图像生成模型;阿里通义 Qwen-TTS 发布:支持 3 种中文方言 + 7 种双语发音

百度开放23款大模型:Ernie 4.5性能比肩OpenAI O1

Ernie 4.5[1]重磅发布 23 款开放权重大模型,包括 VLM 和 LLM 两大系列。

从官方数据显示,LLM版本超越DeepSeek v3和Qwen 235B,而VLM版本则可与OpenAI O1相媲美。所有模型均基于Apache 2.0许可,完全开放商业用途。

此次发布的模型参数范围从0.3B到424B不等,覆盖了各种应用场景需求。佬们可以在在Hugging Face[2]下载这些模型。

先不谈模型性能,这还是我认识的百度吗

Ernie 4.5技术报告: https://yiyan.baidu.com/blog/publication/ERNIE_Technical_Report.pdf百度Ernie 4.5模型集: https://huggingface.co/collections/baidu/ernie-45-6861cd4c9be84540645f35c9

字节跳动 XVerse 开源:多主体身份一致图像生成模型

字节跳动最新开源XVerse 模型[3],实现了多主体图像生成中身份一致性。

该模型不仅能保持多个角色身份特征稳定,还支持高度自定义的姿势、风格和灯光调节。

目前代码和模型已经开源,佬们可以在 github 上查看

字节跳动 XVerse 开源项目: https://github.com/bytedance/XVerse

阿里通义 Qwen-TTS 发布:支持 3 种中文方言 + 7 种双语发音

阿里通义最新发布 Qwen-TTS[4] 语音合成模型,目前支持三种特色中文方言:北京话、上海话和四川话。更提供 7 种专业级双语发音人声:Cherry、Ethan、Chelsie、Serena、Dylan、Jada 和 Sunny。

不过略显遗憾的是,官方暂时没有开源计划,开发者需要通过 API[5] 进行调用,具体接口文档和计费标准可以参考阿里云官方说明。

Qwen-TTS 语音合成模型官网: https://qwenlm.github.io/zh/blog/qwen-tts/Qwen-TTS API 接口文档: https://help.aliyun.com/zh/model-studio/qwen-tts


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

百度 大模型 Ernie 4.5 字节跳动 XVerse 阿里通义 Qwen-TTS
相关文章