我大学本科学的是计算机,也玩过一些AI,来谈谈个人对这次AI伪造的一些疑惑:
第一:目前AI能不能模拟丰富的情感
从暴露的卢文庆录音来看,这段录音有比较丰富的情感变化,有愤怒、有自负、有嘲讽……但是目前的AI模拟人声情感会比较单一,比较难做到快速的情感转换。
第二:录音中的另一个女声从何而来
这段录音中除了卢文庆本人的声音外,还有一个女声,通报说嫌疑人在网络上收集了卢文庆的声音伪造,但是女声怎么来的没有说明,如果是有人刻意造假,为何要加一个声,短短几句女声就又要多训练一个模型,工作量直接翻倍,不合常理。
第三:女声和卢文庆声音衔接和融合堪称完美
从暴露的声音来看,女声与卢文庆的两者声音无论从语境、内容还是环境声音,包括语气都配合的天衣无缝,如果这是AI合成,技术难度可以想象。
第四:通报犯罪嫌疑人年龄只有25岁
通报说犯罪嫌疑人年龄25岁,没有提及学历,也没有公布名字、单位和工作等信息,正常来讲,25岁应该是研究生,如果天才一点那就是博士……
25岁的年纪,能用AI把人声训练到如此的水平,那绝对不是无名之辈,绝对能算AI届数得上的人才,只要他能做出这种级别的声音训练模型,他一定是各大投入大模型公司的重点关注对象。
第五:按照卢文庆的性格来看,如果录音是伪造,他绝对第一时间跳出来,忍不了一点…
从卢文庆醉酒直播可以看出卢文庆是一个有点自负、目中无人的人,绝对不是那种受到委屈能够忍气吐声的人。
差不多了,各位可补充。