用CNN識別出物體後,需要用文字轉語音工具把識別結果讀出來。文字轉語音的工具有很多,比如festival、espeak等。
Ubuntu 14.04安裝festival
sudo apt-get install festival
Ubuntu 14.04安裝espeak
sudo apt-get install espeak
espeak -ven+f3 -k5 -s150 "hello world"
嘗試之後,個人覺得pico2wave效果更好些,所以最終採用pico2wave。
Ubuntu 14.04安裝pico2wave
sudo apt-get install libttspico-utils
安裝後創建腳本文件tts_reader.sh。
#!/bin/bashpico2wave -l=de-DE -w=/tmp/test.wav "$1"aplay /tmp/test.wavrm /tmp/test.wav
使用它讀取文本內容。
tts_reader.sh "hello world"
或者讀取整個文件的內容:
tts_reader.sh "$(cat)"
音頻測試內容:hello,welcome to my home
當然離線模塊的效果整體不如在線效果,也只是勉強可用,如果要達到比較好的效果,可以採用百度、科大訊飛等的在線文字轉語音服務。
閱讀更多 半杯茶的小酒杯 的文章