語音識別,讓計算機能夠把人發出的有意義的語音變成書面語言

語音識別系統是進行數據錄入、文字處理、會話處理最為簡便的方法。語音識別可實現從語音到文本的轉換,即讓計算機能夠把人發出的有意義的語音變成書面語言。通俗地講就是讓機器能夠聽懂人說的話。所謂聽懂,有兩層意思,一是指把用戶所說的話逐詞逐句轉換成文本;二是指正確理解語音中所包含的要求,而不要求所有詞都轉換正確。

語音識別,讓計算機能夠把人發出的有意義的語音變成書面語言

語音識別技術(ASR)是以語音為研究對象,涉及生理學、心理學、語言學、計算機科學以及信號處理等諸多領域,甚至還涉及人的體態語言(如人在說話時的表情、手勢等行為動作可幫助對方理解),目前常見的識別技術一般採用隱馬爾可夫模型HMM(Hidden Markov Model)來建模。

語音識別,讓計算機能夠把人發出的有意義的語音變成書面語言

它的基本原理是系統首先對大量的真實世界中的人的語音進行分析,並建立模型。在識別時,系統同樣先對輸入的語音進行分析,提取特徵,然後通過一定的算法並使用已建立的模型,從而識別出用戶所說的話。

語音識別,讓計算機能夠把人發出的有意義的語音變成書面語言

隨著語音識別技術的逐漸成熟,語音識別技術開始得到廣泛的應用,涉及日常生活的各個方面如電信、金融、新聞、公共事業等行業,通過採用語音識別技術,可以極大地簡化這些領域的業務流程以及操作;提高系統的應用效率。典型的應用就是使用計算機對通過電話輸入的語音作出應答,如呼叫轉移、電話調查、銀行電話付賬、股票報價、賬戶餘額查詢等。


分享到:


相關文章: