把一段文字转语音,这个语音听起来像是自己的声音。
废话
这就是最近很火的克隆声音技术。这个技术将越来越多的用在教育领域,比如用自己的声音给在线课堂授课。
或者用在智能硬件上,让小孩随时听到家长的声音。试想,如果婴儿婴儿随时能听到妈妈的声音,这样解放妈妈的同时宝宝也能感知到妈妈随时在身边。可以预计,以后的天猫精灵,百度音响之类的,都是将支持用家长的音色发声。
在短视频制作也是一样,可以生成自己的语音配音,在主播缺场的情况下,依然可以用主播的声音切片发视频。
技术实现:
文字转自己声音办法很多:
办法一:使用RVC技术,提供3分钟~30分钟的声音干声训练声音模型,训练好了声音模型就能生成新的语音。
办法二:使用chatTTS技术,这项技术需要10秒钟语音就能克隆一个人的声音。
办法三:使用CosyVoice,这项技术只需要3秒甚至1秒就能克隆一个人的声音。
还有很多别的技术,都可以提供这个服务,比如fishTTS,或者国外的许多技术,但是外国的技术更多的关注是否有外国人的味道。
我们把这项技术做成了页面,在公众号上传一段你的语音,就能用这段语音生成文字。实现1秒钟复刻声音。
免费体验:
微信关注“绘声美音”公众号,关注后按照提示步骤,一步一步操作即可。
在线使用:
登录网站后,首先找到“ALI声音库”,创建人物,然后上传这个人物的声音,最后把填写文字,稍等片刻就实现了文字转语音。
企业API:
为企业定制的API,只需要用户上传这个声音的音色和要生成的文字,就能生成这个声音的音频。毕竟这需要用到GPU等显卡,这是独立集成的风险所在。
让自己的声音出现更多的场合,可以预料,以后的天猫精灵,小度在家类似的硬件产品将会越来多的使用这个技术。
保护自己的声音
最后一点是要保护好自己的声音。陌生的电话甚至不要任何回复,甚至连“你好”,这两个字都不要回复,因为只需要两1秒钟,就能克隆一个人的声音。更加不要发语音到群里,防人之心不可无。