一,、github克隆項(xiàng)目
特別注意下載的是v0.01版本
二、Python環(huán)境
1. Python3.9下載以及Pycharm安裝
可以參考這位大佬的文章 https://blog.csdn.net/c_lanxiaofang/article/details/109902269
2. 下載torch:
(一) 打開pycharm控制臺(tái)查看環(huán)境:括號(hào)里面的是py3.9,,與我們創(chuàng)建的python環(huán)境一樣
(二) 環(huán)境正確后安裝torch,,命令如下文章來源站點(diǎn)https://www./
pip install torch==1.9.0 -i https://pypi.tuna./simple
pip install torchvision==0.10.0 -i https://pypi.tuna./simple
3. 其他必須需要的庫:
pip install -r requirements.txt -i https://pypi.tuna./simple
4. 安裝webrtcvad-wheels:
pip install webrtcvad-wheels -i https://pypi.tuna./simple
5. 安裝ffmpeg:
安裝過程參考: https://blog.csdn.net/xiaoxueyaoxuexi/article/details/110451006
三、運(yùn)行代碼
1. 下載預(yù)訓(xùn)練模型
鏈接:https://pan.baidu.com/s/1Scp1pzKJVeSa_ZlOQm-wGA
2. 將saved_models放入項(xiàng)目中的synthesizer目錄中
3. 代碼修改
找到項(xiàng)目中的“/synthesizer/utils/symbols.py”文件修改代碼如下,,直接注釋上邊的_characters,,并把下面的_characters放開就OK啦,如下圖
4. 終端輸入指令
(一)GUI界面: 命令:
python demo_toolbox.py
流程:
- 先“打開本地”或者是錄音,,上傳錄音要是.wav格式
- 推薦大家一個(gè)m4a轉(zhuǎn)mav的免費(fèi)網(wǎng)站 https://www./cn/audio/m4a-to-wav/
- 進(jìn)行模型選擇,,按我下面這樣就可以,Synthesize選擇ceshi,,Vocoder選擇pretrained
- 再點(diǎn)擊右側(cè)的“Synthesize and vocode”
- 左下方點(diǎn)擊“Export”可以導(dǎo)出文件
截圖:
(二)web界面: 命令:
python web.py
截圖:
四,、音質(zhì)優(yōu)化
-
導(dǎo)入模型后將“Enhance vocoder output”勾選好,可以提高清晰度,。
-
可以嘗試調(diào)整style和accuracy,然后點(diǎn)擊“synthesize only”,,調(diào)節(jié)至左下角的圖像出現(xiàn)分段,,可以看出來是一個(gè)一個(gè)的吐字,及吐字清晰即可點(diǎn)擊“vocode only”,,如下圖
效果好的語音如下圖的效果:
問題反饋
大家有什么問題,,可以評(píng)論區(qū)提問,我了解的話會(huì)幫大家解答,!
|