中文語音克隆|MockingBird（擬聲鳥）github項(xiàng)目運(yùn)行流程（一次跑通）

星光閃亮圖書館 2023-05-26 發(fā)布于江蘇

展開全文

一,、github克隆項(xiàng)目

特別注意下載的是v0.01版本
在這里插入圖片描述

二、Python環(huán)境

1. Python3.9下載以及Pycharm安裝

可以參考這位大佬的文章
https://blog.csdn.net/c_lanxiaofang/article/details/109902269

2. 下載torch：

（一）打開pycharm控制臺(tái)查看環(huán)境：括號(hào)里面的是py3.9,，與我們創(chuàng)建的python環(huán)境一樣
在這里插入圖片描述

（二）環(huán)境正確后安裝torch,，命令如下文章來源站點(diǎn)https://www./

	pip install torch==1.9.0 -i https://pypi.tuna./simple
	pip install torchvision==0.10.0 -i https://pypi.tuna./simple

3. 其他必須需要的庫：

	pip install -r requirements.txt -i https://pypi.tuna./simple

4. 安裝webrtcvad-wheels：

	pip install webrtcvad-wheels -i https://pypi.tuna./simple

5. 安裝ffmpeg：

安裝過程參考：
https://blog.csdn.net/xiaoxueyaoxuexi/article/details/110451006

三、運(yùn)行代碼

1. 下載預(yù)訓(xùn)練模型

鏈接：https://pan.baidu.com/s/1Scp1pzKJVeSa_ZlOQm-wGA

2. 將saved_models放入項(xiàng)目中的synthesizer目錄中

在這里插入圖片描述

3. 代碼修改

找到項(xiàng)目中的“/synthesizer/utils/symbols.py”文件修改代碼如下,，直接注釋上邊的_characters,，并把下面的_characters放開就OK啦，如下圖
在這里插入圖片描述

4. 終端輸入指令

（一）GUI界面：
命令：

	python demo_toolbox.py

流程：

先“打開本地”或者是錄音,，上傳錄音要是.wav格式
推薦大家一個(gè)m4a轉(zhuǎn)mav的免費(fèi)網(wǎng)站 https://www./cn/audio/m4a-to-wav/
進(jìn)行模型選擇,，按我下面這樣就可以，Synthesize選擇ceshi,，Vocoder選擇pretrained
再點(diǎn)擊右側(cè)的“Synthesize and vocode”
左下方點(diǎn)擊“Export”可以導(dǎo)出文件
截圖：

（二）web界面：
命令：

	python web.py

截圖：
在這里插入圖片描述

四,、音質(zhì)優(yōu)化

導(dǎo)入模型后將“Enhance vocoder output”勾選好，可以提高清晰度,。
可以嘗試調(diào)整style和accuracy，然后點(diǎn)擊“synthesize only”,，調(diào)節(jié)至左下角的圖像出現(xiàn)分段,，可以看出來是一個(gè)一個(gè)的吐字，及吐字清晰即可點(diǎn)擊“vocode only”,，如下圖

效果好的語音如下圖的效果：

問題反饋

大家有什么問題,，可以評(píng)論區(qū)提問，我了解的話會(huì)幫大家解答,！

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào),。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：星光閃亮圖書館 > 《軟件推薦》

舉報(bào)/認(rèn)領(lǐng)