原创 小茸茸 2025-03-21 09:54 重庆
Reka Flash 3:21B 开源推理模型;OpenAI 发布 o1-pro API:金子做的token;OpenAI 发布全新音频模型:文本转语音与语音转文本
Reka Flash 3:21B 开源推理模型
Reka Flash 3[1] 是一款开源的 21B 通用推理模型,完全从零开始训练。它在性能上可与 o1-mini 等模型媲美,是目前同等规模中最出色的开源模型之一。
模型本身基于 Apache 2.0 开源,佬们也可以在其官网[2]上体验。
Reka Flash 3 模型页面: https://huggingface.co/RekaAI/reka-flash-3
Reka Flash 3 官网: https://space.reka.ai/
OpenAI 发布 o1-pro API:金子做的token
OpenAI o1-pro[3] API 现已正式上线,输入为 150 美元/百万 token,输出更是高达 600 美元/百万 token。
这 token 是金子做的,还是银子做的?
OpenAI o1-pro 官方文档: https://platform.openai.com/docs/models/o1-pro
OpenAI 发布全新音频模型:文本转语音与语音转文本
OpenAI 昨天发布了全新的音频模型,主要包括文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大类:
文本转语音模型(gpt-4o-mini-tts):
最大亮点是其“可操控性”(steerability),可以精确控制语音的语调、节奏和表达方式。佬们可以在 OpenAI FM[4] 中测试体验。
我简单测试了下,中文 TTS 发音有的音色还是一股大佐味,而且语速慢听起来感觉怪怪的。
语音转文本模型(gpt-4o-transcribe 和 gpt-4o-mini-transcribe):
相较于 OpenAI 之前的 Whisper 模型,在语音识别准确性上有了显著提升,尤其是在处理多样化口音和嘈杂环境下的表现更为出色。
API 价格和 Whisper 差不多,4o约为每分钟0.003。
更多更新细节,可以看 OpenAI 的官方博客[5]。
OpenAI FM 测试平台: https://www.openai.fm/
OpenAI 官方博客: https://openai.com/index/introducing-our-next-generation-audio-models/
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!