用TensorFlow看圖說話學英語(1)-文本語音

用TensorFlow看圖說話學英語(1)-文本語音

用CNN識別出物體後,需要用文字轉語音工具把識別結果讀出來。文字轉語音的工具有很多,比如festival、espeak等。

Ubuntu 14.04安裝festival

sudo apt-get install festival

Ubuntu 14.04安裝espeak

sudo apt-get install espeak

espeak -ven+f3 -k5 -s150 "hello world"

嘗試之後,個人覺得pico2wave效果更好些,所以最終採用pico2wave。

Ubuntu 14.04安裝pico2wave

sudo apt-get install libttspico-utils

安裝後創建腳本文件tts_reader.sh。

#!/bin/bashpico2wave -l=de-DE -w=/tmp/test.wav "$1"aplay /tmp/test.wavrm /tmp/test.wav

使用它讀取文本內容。

tts_reader.sh "hello world"

或者讀取整個文件的內容:

tts_reader.sh "$(cat )"

音頻測試內容:hello,welcome to my home

當然離線模塊的效果整體不如在線效果,也只是勉強可用,如果要達到比較好的效果,可以採用百度、科大訊飛等的在線文字轉語音服務。


分享到:


相關文章: