首页 > IT资讯

微软发布AI声音生成工具VALL-E


微软最近发布了一款名为VALL-E的人工智能工具,只需3秒音频即可模仿人说话。该工具经过60000小时英语语音数据的训练,并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

本文链接:https://www.zhanque.net/note/2237.html