Cnbeta 前天 15:08
ChatGPT 的高级语音模式获得重大更新 听起来更自然
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI 持续改进其高级语音模式,最新升级使其在自然度和情感表达上更上一层楼。新版本不仅优化了语音的语调和节奏,还引入了语言翻译功能,让用户可以通过语音进行实时翻译。尽管存在一些已知限制,如偶尔的音频质量下降和幻觉问题,但整体改进趋势预示着人机对话体验将更加流畅和人性化。目前,该更新仅对 ChatGPT 付费用户开放。

🗣️ OpenAI 的高级语音模式通过原生多模态模型(如 GPT-4o)实现快速响应,平均响应时间为 320 毫秒,接近人类对话速度。

🎤 最新升级着重于提升语音的自然度,包括更细腻的语调、自然的节奏(停顿和强调),以及更准确的情感表达,例如同情和讽刺。

🌐 新版本引入了语言翻译功能,用户可以通过语音指令让 ChatGPT 实时翻译对话内容,省去了对专用翻译应用的需求。

⚠️ OpenAI 承认更新后存在一些已知限制,例如偶尔出现的音频质量下降和幻觉现象,但承诺将持续改进,提升音频一致性。

OpenAI 去年推出了GPT-4o,同时带来了高级语音模式。该功能使用原生多模态模型(例如 GPT-4o),最快可在 232 毫秒内响应音频输入,平均响应时间为 320 毫秒,与人类在典型对话中的响应时间相似。它还可以生成更自然的音频,捕捉非语言线索(例如说话速度),并表达情感。

今年年初,OpenAI 发布了高级语音模式的小幅更新,减少了打断并改善了口音。今天,OpenAI 再次对高级语音模式进行了重大升级,使其听起来更加自然、更贴近人类。现在,语音回复的语调更加细腻,节奏更加自然(包括停顿和强调),并且能够更准确地表达某些情绪,例如同情和讽刺。

本次更新还引入了翻译功能。ChatGPT 用户现在可以使用高级语音模式进行语言间翻译。只需命令 ChatGPT 开始翻译,它就会在整个对话过程中持续翻译,直到收到停止指令。此功能有效地取代了对专用语音翻译应用的需求。

目前,更新后的高级语音模式仅适用于 ChatGPT 付费用户。OpenAI 还指出,此最新更新存在一些已知的限制,概述如下。

尽管仍然存在一些小的限制,但持续的改进表明未来人类和人工智能对话之间的界限将变得越来越模糊。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT-4o 语音模式 语言翻译
相关文章