金子做的token：OpenAI o1-pro API；OpenAI 全新音频模型：文本转语音与语音转文本；21B 开源推理模型

原创小茸茸 2025-03-21 09:54 重庆

Reka Flash 3：21B 开源推理模型；OpenAI 发布 o1-pro API：金子做的token；OpenAI 发布全新音频模型：文本转语音与语音转文本

Reka Flash 3^[1] 是一款开源的 21B 通用推理模型，完全从零开始训练。它在性能上可与 o1-mini 等模型媲美，是目前同等规模中最出色的开源模型之一。

模型本身基于 Apache 2.0 开源，佬们也可以在其官网^[2]上体验。

Reka Flash 3 模型页面: https://huggingface.co/RekaAI/reka-flash-3
Reka Flash 3 官网: https://space.reka.ai/

OpenAI o1-pro^[3] API 现已正式上线，输入为 150 美元/百万 token，输出更是高达 600 美元/百万 token。

这 token 是金子做的，还是银子做的？

OpenAI o1-pro 官方文档: https://platform.openai.com/docs/models/o1-pro

OpenAI 昨天发布了全新的音频模型，主要包括文本转语音（Text-to-Speech, TTS）和语音转文本（Speech-to-Text, STT）两大类:

文本转语音模型（gpt-4o-mini-tts）:

最大亮点是其“可操控性”（steerability），可以精确控制语音的语调、节奏和表达方式。佬们可以在 OpenAI FM^[4] 中测试体验。

我简单测试了下，中文 TTS 发音有的音色还是一股大佐味，而且语速慢听起来感觉怪怪的。

语音转文本模型（gpt-4o-transcribe 和 gpt-4o-mini-transcribe）:

相较于 OpenAI 之前的 Whisper 模型，在语音识别准确性上有了显著提升，尤其是在处理多样化口音和嘈杂环境下的表现更为出色。

API 价格和 Whisper 差不多，4o约为每分钟0.003。

更多更新细节，可以看 OpenAI 的官方博客^[5]。

OpenAI FM 测试平台: https://www.openai.fm/
OpenAI 官方博客: https://openai.com/index/introducing-our-next-generation-audio-models/

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享五连警告，这对我真的很重要！

Fish AI Reader