文字转自己的声音 - 克隆声音官方博客

把一段文字转语音，这个语音听起来像是自己的声音。

这就是最近很火的克隆声音技术。这个技术将越来越多的用在教育领域，比如用自己的声音给在线课堂授课。

或者用在智能硬件上，让小孩随时听到家长的声音。试想，如果婴儿婴儿随时能听到妈妈的声音，这样解放妈妈的同时宝宝也能感知到妈妈随时在身边。可以预计，以后的天猫精灵，百度音响之类的，都是将支持用家长的音色发声。

在短视频制作也是一样，可以生成自己的语音配音，在主播缺场的情况下，依然可以用主播的声音切片发视频。

文字转自己声音办法很多：

办法一：使用RVC技术，提供3分钟～30分钟的声音干声训练声音模型，训练好了声音模型就能生成新的语音。

办法二：使用chatTTS技术，这项技术需要10秒钟语音就能克隆一个人的声音。

办法三：使用CosyVoice，这项技术只需要3秒甚至1秒就能克隆一个人的声音。

还有很多别的技术，都可以提供这个服务，比如fishTTS，或者国外的许多技术，但是外国的技术更多的关注是否有外国人的味道。

我们把这项技术做成了页面，在公众号上传一段你的语音，就能用这段语音生成文字。实现1秒钟复刻声音。

微信关注“绘声美音”公众号，关注后按照提示步骤，一步一步操作即可。

登录网站后，首先找到“ALI声音库”，创建人物，然后上传这个人物的声音，最后把填写文字，稍等片刻就实现了文字转语音。

为企业定制的API，只需要用户上传这个声音的音色和要生成的文字，就能生成这个声音的音频。毕竟这需要用到GPU等显卡，这是独立集成的风险所在。

让自己的声音出现更多的场合，可以预料，以后的天猫精灵，小度在家类似的硬件产品将会越来多的使用这个技术。

最后一点是要保护好自己的声音。陌生的电话甚至不要任何回复，甚至连“你好”，这两个字都不要回复，因为只需要两1秒钟，就能克隆一个人的声音。更加不要发语音到群里，防人之心不可无。

Related Posts