在對話音設計編碼方案之前,首先需要了解話音波形的基本特性

在對話音設計編碼方案之前,首先需要了解話音波形的基本特性,在這些特性基礎上,完成對聲音數據的壓縮編碼、聲音的識別以及文本-聲音的轉換等。

在對話音設計編碼方案之前,首先需要了解話音波形的基本特性

話音是由於肺部中的受壓空氣沿著聲道通過聲門而產生的。普通男人的聲道從聲門到嘴的平均長度約為17釐米,這個事實反映到聲音信號中,相當於在1 ms數量級內的數據具有相關性,這種相關稱為短期相關。

在對話音設計編碼方案之前,首先需要了解話音波形的基本特性

聲道也被認為是一個濾波器,這個濾波器有許多共振峰,這些共振峰的頻率受隨時間變化的聲道形狀所控制,例如口腔為可變共振腔,舌的移動就會改變聲道的形狀。許多話音編碼器用一個短期濾波器來模擬聲道。但由於聲道形狀的變化比較慢,模擬濾波器的傳遞函數的修改不需要那麼頻繁,典型值在20 ms左右。

在對話音設計編碼方案之前,首先需要了解話音波形的基本特性

壓縮空氣通過聲門激勵聲道濾波器,根據激勵方式不同,發出的話音分成三種類型:濁音(voiced sounds),清音(unvoiced sounds)和爆破音(plosive sounds)。


分享到:


相關文章: