華為EMUI語音助手長大了,可識別主人聲音,背後技術揭祕

華為EMUI的小藝長大了——看下圖,猜一猜這一次小藝又進化了什麼能力?

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

天啦,語音操作下,你想插嘴打斷就打斷了?嘈雜環境下,怎麼不被噪聲干擾?

華為EMUI語音助手長大了,升級EMUI10後的智能語音多了這個功能,可識別主人聲音,瞬間讓智能語音好用很多。長按電源鍵1秒喚醒小藝:驚不驚喜,意不意外!這麼“skr”的能力,讓我們細細說來。

過濾掉噪聲,掃除基礎障礙

實現插嘴打斷的第一步,是讓小藝在嘈雜環境下,清楚地識別出人聲。聲音本質是攜帶信息的能量波,為了把你的聲音從茫茫的噪聲海中pick出來,小藝通過音頻降噪和語音識別降噪,共同抑制噪聲能量、增強人聲能量。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

如果說在嘈雜的背景聲中選出人聲屬於眾裡尋他千百度,那旁邊有人在大聲說話、能量波強度也相似的干擾場景就屬於真假美猴王了。對於這個問題,小藝使用華為特有的VAD和ASR識別機制來解決。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

普通的VAD技術可以識別出噪聲和人聲。而華為特有的VAD結合ASR識別機制,可以區分出噪聲、無效人聲、有效人聲。做到噪音和無效人聲不識別,當前有效人聲才能識別。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

消除播報的迴音,清掃第二隻攔路虎

既然能在嘈雜環境下識別出你的聲音,那隨時打斷小藝,也就是小意思了。但插嘴打斷是在播報時候進行的,那就不可避免的會把手機語音播報的內容給收進去。理想的方案是回聲消除法:即用原始音消除播報回聲的能量。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

現實中,因為器件和聲音外放的原因,聲音的波形會發生變化,實際的回聲聲波和原始聲波不能成線性,說人話就是不能消除。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

這就輪到華為獨特的AI消噪技術上場了。它引入深度神經網絡來訓練智能的語音識別聲學模型,消除變形的能量。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

不是對我說的話,我絕不會誤解

過濾掉這兩種干擾後,當你在小藝播報過程中打斷它時,它都能準確識別出你的聲音、理解你的意圖,並做出回應。或許你還有一個疑問:小藝播報時我跟旁人的對話,豈不是也會打斷小藝?

不會的。小藝引入了強大的意圖分類模型,通過把文字識別成意圖,可以分辨出你是否在對它講話,從而避免被幹擾。

華為EMUI語音助手長大了,可識別主人聲音,背後技術揭秘

經歷了九九八十一難,你的語音在各種干擾的情況下,經歷了語音轉換和語義識別,實現了嘈雜環境、人聲干擾、播報回聲干擾中的識別,最終成功插嘴打斷。

成人的世界沒有一件事是容易的。

不過再難,小藝也會與你一路同行,共同成長。

這麼好用的語音助手黑科技哪裡有呢?在裝有EMUI10的全新Mate30系列手機上,快快體驗一下吧!

歡迎關注 [ 華為手機功能教程] ,人人都做手機達人。


分享到:


相關文章: