深度财经头条 2024年07月31日
OpenAI向部分用户开放GPT-4o语音模式 今秋将扩大至所有付费用户
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI向部分ChatGPT Plus用户推出GPT - 4o的语音模式,具有更自然实时对话等功能,初期功能有限,且该公司仍在开发其他功能并注重避免法律纠纷。

🎤OpenAI宣布即日起向部分ChatGPT Plus用户推出GPT - 4o的语音模式,此模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户情绪,但实时响应和可打断对话是语音助手的技术难点。

📅OpenAI原定于6月底开放语音模式,后推迟至7月,今年秋季将向所有ChatGPT Plus用户开放。目前该模式初期功能有限,如无法使用计算机视觉功能,且有四种预设声音。

🎬OpenAI仍在开发5月发布会期间展示的视频和屏幕共享功能,这些功能推出时间尚未确定。同时,OpenAI已引入新过滤器,以避免陷入法律纠纷,此前曾因语音问题收到律师函。


财联社7月31日讯(编辑 夏军雄)当地时间周二(7月30日),美国人工智能(AI)研究公司OpenAI宣布,即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。

据OpenAI介绍,高级语音模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。实时响应和可打断对话是目前语音助手公认的技术难点。

OpenAI在今年5月推出了新版本大模型GPT-4o,同时还展示出了语音模式。该公司原定于6月底开始逐步向用户开放语音模式,但最终决定推迟至7月发布。语音模式将于今年秋季向所有ChatGPT Plus用户开放。

OpenAI周二表示:“通过逐步推出,我们可以密切监控使用情况,并根据实际反馈不断改进模型的能力和安全性。”该公司还透露,它仍在开发5月发布会期间展示的视频和屏幕共享功能。这些功能尚未确定推出时间。

因此,语音模式初期的功能将比较有限。例如,ChatGPT将无法使用计算机视觉功能,该功能可让聊天机器人通过智能手机的摄像头对用户的舞蹈动作提供语音反馈。

目前GPT-4o语音模式可使用四种预设声音,Juniper、Breeze、Cove和Ember,这些声音是与付费配音演员合作制作的。

此前,ChatGPT一款名为Sky的女性配音被指与好莱坞明星斯嘉丽·约翰逊十分相似。在收到约翰逊团队的律师函后,OpenAI暂停使用Sky语音。

OpenAI还表示,它已引入了新的过滤器,以确保软件能够发现并拒绝某些生成音乐或其他形式的受版权保护的音频的请求。对于AI公司而言,避免陷入法律纠纷已成为格外需要警惕的事项。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT - 4o语音模式 避免法律纠纷 功能开发
相关文章