燚智能硬件開發網
用簡單的語言,講複雜的技術!
這兩年,智能音箱很火,天貓精靈賣出了百萬臺,京東的叮咚音箱、小米的小愛同學也好評頗多。亞馬遜的Echo系列賣了上千萬臺了。
有些智能語音識別的軟件,還能支持“自定義喚醒詞”,用戶可以設定一個自己喜歡的名字,來叫醒設備。
那麼,這些名字有哪些奧秘呢?
什麼是喚醒詞
喚醒詞,就是智能音箱的“名字”,叫了它的名字它就理你,叫錯了就不理了。
智能音箱內部有一組麥克風,7x24小時不停的錄音,和內置的“喚醒詞模型”比對,一旦對比成功,就認為你在叫它了,就開始做語句識別。
不光是智能音箱,像iPhone的“hi siri”也是這樣的,iPhone6沒有獨立的低功耗聲音比對處理器(喚醒處理器),語音喚醒的功耗很高,因此只能在插電的情況下叫“hi siri”,後續機型都有了獨立處理器,功耗低了,就可以隨時隨地叫醒Siri了。
語音喚醒的核心:喚醒詞+硬件+算法
那麼,如何做99.99%的喚醒率?(當前各家都沒做到這麼高,略差一些)
高識別率是一個非常系統的工程,主要有麥克風選型、聲學的設計、降噪和識別算法、喚醒詞設計。
一個語音智能產品,叫半天都不理你,肯定想把它摔了。喚醒詞選擇非常重要。
固定喚醒詞比自定義喚醒詞更好,喚醒率更高、距離更遠。自定義喚醒詞采用的是通用化模型,固定喚醒詞用的是算法公司優化過的模型,所以會更好。(但是要付出幾十萬的調試費用)
喚醒詞選擇的幾個原則
1:爆破音更好
喚醒中最好含有帶爆破音的字:例如“胖”“朋”,能量高,易喚醒.
2:嘴巴張的越大越好
韻母,宜選擇大口型,開口音韻母的音節。a、an、ang、ia、ian、iang、ai、ao、ua、uan、uang等。避免e、en、eng,i、in、ing 等。
例如 :霞,芭,娃,哈 等詞比較好。
避免:基尼,咪咪這樣的喚醒詞。
3:聲母儘量爆破音
聲母,宜選擇包含爆破音聲母的音節。如,d、b、t、l、z、zh等 (但相對來說,韻母的選擇更重要)。
4:無連音
音節之間避免連音。如無聲母、前一個韻母與後面聲母相同或近似。例如避免“天安門”、“第一視頻”。
5:避免使用常用詞
為避免誤喚醒,喚醒詞儘量為平常講話很少觸及到的用詞,音節數儘量≥3。其中4字較理想。不建議過長(大於6),過短易誤喚醒,過長不利於用戶記憶與頻繁朗讀。
哪家的喚醒詞最好?
天貓精靈:普通,識別度一般,讀出來感覺是在打廣告。
小愛同學:較好,易於識別,親和力也很高。
叮咚叮咚:普通,識別度一般,叫起來感覺比較傻
Hi Siri:較好,易於識別,讀出來很通暢。
Alexa:最好,智能音箱領軍引擎,各方面都不錯(除了不能在國內使用)
OK Google:較好,識別度一般,但讀出來很自然
燚智能硬件開發網
智能硬件開發實戰派
精彩內容回顧
閱讀更多 燚智能 的文章