老板AI应用课:只需3步,用AI克隆你自己的声音
上一篇文章发布后,有小伙伴说想克隆一下抖音某主播的声音。
在保证不侵犯人家版权的前提下,自己用用还是可以的。
尽量避免一些影视、明星、知名人物的声音克隆,你的声音就随便了。
克隆跟定制音色一样,相当于定制、复制你自己的音色。
随着技术和模型的迭代发展,以前需要大量语料去训练才能克隆声音。
现在,一般只需要准备被克隆的声音素材,5-30秒即可完美克隆。
成本和效率大大提升,这也导致了市面上出现了很多声音克隆的AI应用。
比如豆包也支持克隆,但仅限于自己的APP使用,诸如此类。
绝大部分的声音克隆AI应用软件都是收费的,如果你高频使用还算划算。
偶尔玩玩的就没有必要了,因而老马一直都推荐电脑端的AI应用软件。
毕竟电脑才是生产力,手机端目前还没法达到或者取代的效果。
废话不多说,接下来老马就以克隆一个蜡笔小新的声音为例。
演示一下如何通过三个步骤克隆你自己的声音。
1、准备需要被克隆的声音素材
如果要克隆你自己的声音,你可以使用电脑麦克风,或者简单的手机录音,再把录制好的文件,用微信文件传输助手发送到电脑端即可。
这个操作的难度都不大,但你是要克隆某个抖音博主的声音,那就得先用抖音APP保存一下他的短视频,最好是单个人口播视频,没有其他人参与的。
避免多人参与,声音混杂。下载好的短视频也同样通过微信文件传输助手发送到电脑上。
下一步,你就可以使用剪映或类似的工具,对声音进行裁剪。你自己录制的声音也是如此,导入剪映映之后,裁剪成5-30秒内,再保存导出。
或者下载的抖音短视频,导入剪映后,先进行音频分离,然后把视频轨道删除掉,只保留音频轨道,再裁剪成5-30秒内保存导出,如图:
完成以上步骤,你会发现,自己录制的声音,可能会有点杂音和背景噪音。而抖音短视频提取出来的声音,可能有背景音乐。
那么下一步就是得对声音进行降噪,或者是分离人声跟背景音乐,只保留人声。
也就是说,无论你是准备克隆自己声音,还是他人声音,最终需要的素材都是纯人声说话的,无任何背景音乐、杂音、噪音以及其它人的声音。
这里我们会用到的工具是Aifooler,功能很强大,而且完全免费,网址如下:
https://www.aifooler.com/
老马演示的是克隆蜡笔小新的声音,但是视频提取出来的声音,有背景音乐,所以需要用到以上工具进行人声分离,我们先来听一下原来带背景音乐的声音,如下:
https://www.doubao.com/drive/s/1775abadfac6d74c
接下来是把这段含有背景音乐的声音,上传到Aifooler进行人声分离,然后下载的时候,只选择人声下载,如图:
经过处理后的声音就没有背景音乐了,而且非常干净纯粹,这样的素材待会去克隆,效果就很好,大家可以听一下:
https://www.doubao.com/drive/s/f184e095ebfa02f2
现在,我们就拥有了需要被克隆的人声声音素材了,下一步就是去克隆。
2、使用AI超简单克隆声音
我们使用到的工具是Noiz ai网站,比较知名的产品了,每天和每个月送的额度也完全够个人使用,网址如下:
https://noiz.ai/landing
电脑浏览器打开后,先注册登录一下,然后通过左侧的菜单栏,切换到音频创作中的音频库,即可添加声音,如图:
添加声音时,上传你刚才处理好的人声音频文件,也可以录制自己的声音,老马建议是上传文件,毕竟重新录制又会存在各种问题。
上传完之后,稍等分析完毕,如无任何问题,音频长短也没有问题,即可点击下一步,设置一下声音的名称,语言,选择自动降噪,确认即可,如图:
至此,你的声音,或者你想克隆的抖音某博主的声音,就克隆完毕了。
没错,就这么简单,克隆完的声音,通过输入一些文本文字,即可合成新的语音,我们接着下一步操作。
3、使用克隆的声音合成语音
使用刚刚克隆好的声音去合成语音,只需要在Noiz ai的左侧菜单栏的音频创作中点击文本转语音即可,克隆声音是不会消耗免费额度的,文本转语音会。
在左侧的输入框输入你要转成语音的文字,可以插入停顿,标记漏字,支持多语言,右侧默认已经选择了我们刚刚克隆好的音色,也就是克隆好的声音,如图:
老马随便输入了一段人生哲理的文字,使用刚克隆好的蜡笔小新声音音色,最后点击生成语音就搞定了,效果如下:
https://www.doubao.com/drive/s/27fd002dc1461012
Noiz ai默认会给你两个生成语音的版本,你听听哪个效果更好,下载哪个即可,也可以通过右上角的历史按钮查看以往的生成记录。
不过这个网站有时候会有点卡,操作是成功了,但点击播放语音没反应,这时就需要刷新一下,去历史记录里面点击看看。
好了,以上就是今天的分享,有任何问题和需求可以留言,回见!