Tensorflow-wavenet生成模擬聲音

NO IMAGE

1.wavenet
wave介紹:https://deepmind.com/blog/wave … udio/
先用一個短視訊介紹一下wavenet效果
http://v.qq.com/x/page/w0328zc2azc.html

2.下載tensorflow-wavenet
讀者自己先配置好tensorflow
git clone –recursive https://github.com/ibab/tensorflow-wavenet

3.程式碼目錄
wavenet_params.json 這是配置模型的一些相關引數

4.安裝依賴包
pip install -r requirements.txt

5.下載語料庫
語料庫有10個g,解壓後有12個g左右,請預備好足夠的空間,機器不太行的可以忽略此步
http://homepages.inf.ed.ac.uk/ … ar.gz
http://homepages.inf.ed.ac.uk/ … .html #語料庫的介紹

5.準備語料
筆者這裡先用一段小的鋼琴語料做訓練,piano_sample.wav
cd tensorflow-wavenet
mkdir corpus #corpus #用於存放多個訓練的.wav檔案

6.開始訓練
python train.py –help #–batch_size,–num_steps,–learning_rate等等引數
python train.py –data_dir=corpus

7.模型
訓練過程中在logdir有train檔案,train檔案裡有會生成訓練model

8.生成模擬聲音
python generate.py –wav_out_path=generated.wav –samples 160000 ./logdir/train/xxx/model.ckpt-xxx #–samples 16000 16000相當於1秒

9.筆者訓練的效果放在附件
piano_sample.wav #樣本
generated.wav #生成模擬聲音