靠谱的克隆声音软件

靠谱的克隆声音软件

克隆声音用途

生活中有很多需要克隆声音的地方:给短视频配音,在工作中扮演多个角色,通过AI翻唱来改造自己的唱歌方式,在游戏中扮演异性,或者翻唱MV发抖音。

选择软件

市面上用的最广泛的克隆声音技术是免费开源的RVC和gpt-sovits,这两项技术各有优缺点。rvc更倾向于音频变声,而gpt-sovits倾向文字转语音。

如果是单纯的研究技术,建议大家在B站把“花儿不哭”的视频多看几遍,比其他人的要强。

如果就是要用,就不要尝试下载。这些技术有坑,比如群里一些搞了几个月的人弄不明白为什么变声后的音频有电音,其实关键就是声音没有处理干净。还有很多人训练过程内存溢出(戏称炸炉),原因是设置的batch-size超出电脑显存。还有人花了钱买了一堆软件,结果没有部署起来,真是赔了夫人又折兵。这项技术确实有门槛,一方面建议有英伟达显卡,另一方面要求熟悉windows操作。有人看了视频就觉得自己什么都会了,那只能说太幼稚了。

站在前人的肩膀上,踩过很多坑,我们开发了这个靠谱的网站,功能齐全包括:一键提取干声,训练模型,音频/视频变声,实时变声,文字转语音,AI翻唱,短视频翻唱,还有一个模型库。我们这些坑全部填好了,比如训练模型时自动提取干声,先伴奏分离,接着去和声,然后去混响,最后降噪。这样用户有3分钟音频素材,训练的模型质量就很好了。

说这个网站靠谱,首先提供免费试用,免费训练声音模型,免费翻唱歌曲,免费UVR5一键提取干声。然后是费用很明确,就是开通会员,没有其他限制,没有二次收费。我刚接触RVC时遇到一个人,第一次是收很少的软件费,第二次收部署调试费,第三是收模型费,还有后期维护费。

说这个网站靠谱,还有一个是功能简单易用,手机上可以全部完成。我们来看看:

训练声音模型

训练声音模型是变声和翻唱基础。关注“绘声美音”公众号后,看到下图:

关注绘声美音公众号
关注绘声美音公众号

按照提示,选择性别。点击上图“如何上传”

如何上传语音样本
如何上传语音样本

为保证声音样本质量:
1、朗读的环境是安静的,没有车声!没有鸟叫!没有风声!
2、请大声朗读,允许读错或者少读;
3、朗读总时长需要大于3分钟,可多次提交;

大声朗读的内容可以是上面的文案1、文案2、文案3,也可以是你喜欢的文案。在绘声美音“”公众号“按住说话”,上传你的语音样本。

大约30分钟,声音模型训练完成,公众号会发送消息,代表声音模型已经训练成功。

使用声音模型

点击公众号的训练成功通知,进入“克隆声音” -> “声音库”,第一个模型就是刚刚训练的声音。

声音模型的用途

声音模型的用途包括:

  • 翻唱歌曲:进入点歌台选择一首歌让AI董卿翻唱;
  • 文件变声:把视频或音频的声音换成AI董卿的声音;
  • 短视频变声:把在线短视频声音换成“AI董卿”,支持抖音快手等等;
  • 实时变声:用“AI董卿”声音在线语音聊天,支持windows电脑;
  • 文字转语音:使用“AI董卿”将文字转音频文件;