2025-03-21 17:16 四川
实际上,并不是为了发布 openai.fm,而是新的 Text-to-speech(TTS)模型,通过指定且复
实际上,并不是为了发布 openai.fm,而是新的 Text-to-speech(TTS)模型,通过指定且复杂的提示词,让机器可以模仿人类口气说话。
openai.fm 则是这个模型的一个具体的例子
比如上面这个截图,先选择声音,再选择氛围,在脚本中输入你想要说的话,Play 就开始发音了。
主要是氛围,这相当于曾经的提示词,比如预设的这个:
语气:热情、放松、友好,带有牛仔般的沉稳口音,让人感觉平易近人。
标点符号:轻松自然,停顿适度,营造出对话节奏,但又不会让人感觉匆忙。
表达方式:流畅、随和,语速悠闲,让听众感到安心,同时又保持清晰。
措辞:简单、直接、亲切,使用随意、熟悉的语言,让技术支持人员感觉更加亲切。
语气:轻松、热情,镇定自信,让呼叫者感到轻松自在。
我一直觉得,最符合人类使用的机器人,一定是语音交互的。而和人类说话,Siri 那种...太平淡了。你永远都能想象得到,ta会用什么语气和你说话。
而这种模型,会让人类更迷失在机器人与人之间
未来,已经到啦。