原创 小茸茸 2025-07-01 09:48 重庆
百度开放23款大模型:Ernie 4.5性能比肩OpenAI O1;字节跳动 XVerse 开源:多主体身份一致图像生成模型;阿里通义 Qwen-TTS 发布:支持 3 种中文方言 + 7 种双语发音
百度开放23款大模型:Ernie 4.5性能比肩OpenAI O1
Ernie 4.5技术报告: https://yiyan.baidu.com/blog/publication/ERNIE_Technical_Report.pdf百度Ernie 4.5模型集: https://huggingface.co/collections/baidu/ernie-45-6861cd4c9be84540645f35c9
字节跳动 XVerse 开源:多主体身份一致图像生成模型
字节跳动 XVerse 开源项目: https://github.com/bytedance/XVerse
阿里通义 Qwen-TTS 发布:支持 3 种中文方言 + 7 种双语发音
阿里通义最新发布 Qwen-TTS[4] 语音合成模型,目前支持三种特色中文方言:北京话、上海话和四川话。更提供 7 种专业级双语发音人声:Cherry、Ethan、Chelsie、Serena、Dylan、Jada 和 Sunny。不过略显遗憾的是,官方暂时没有开源计划,开发者需要通过 API[5] 进行调用,具体接口文档和计费标准可以参考阿里云官方说明。Qwen-TTS 语音合成模型官网: https://qwenlm.github.io/zh/blog/qwen-tts/Qwen-TTS API 接口文档: https://help.aliyun.com/zh/model-studio/qwen-tts
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!