人工智能音箱與智能音箱有何區別?

萬年青80582133



首先上結論:兩個概念對內行來說是一致的。外行瞎分管不了。哈哈!

作為曾經為小米小愛同學、喜馬拉雅小雅智能音箱、美的小美、易視騰小加提供智能語音解決方案的科技公司AI部門的核心算法,我們內部都將音箱稱為智能音箱。加人工這兩字顯得有些畫蛇添足。

現在的智能基本上都通過深度學習技術+傳統機器學習技術實現。

為了加深您對智能音箱的整體認識,現在將智能影響用到的一些核心技術做一些解答,希望你能更加深入的認識到人工智能如何影響到我們的生活。

語音信號處理

語音信號處理技術有很多的用途,比如語音增強,背景去噪等。總的來說就是需要讓信號語音信號更加“清楚”,清楚的信號對於後面要講到的喚醒和識別來說非常重要,也能降低後續處理的難度。

語音喚醒技術

智能音箱平時出於加電待機狀態,需要通過喚醒啟動語音識別的相應功能。用戶通過設定或者系統默認的喚醒詞啟動交互,比如你會叫“天貓精靈”,"小度小度",“小雅小雅”,“小愛同學”,“小豹小豹”這樣的詞彙,喚醒詞可以是暱稱,也可以是一些其他指令詞“打開點燈”,“提高音量”,“打開空調”等。

喚醒其實是一個小的分類深度神經網絡,所謂神經網絡本質上是一堆矩陣的運算,上過大學高等數學和線性代碼的人都能夠很快入門。

語音識別技術

語音識別簡單來說就是把你的聲音信號(聲音其實是一種特別的波)變為文字信息。他的實現目前也是基於神經網絡來做的,比喚醒複雜一些罷了。

語音理解

當聲波變為文字後顯然機器還無法理解說話內容,這是就需要另外一種人工智能技術NLP-自然語言處理。自然語言處理通過圖中所示方法獲得對文本涉及語義的理解,從而讀懂用戶的意圖。

語音合成

當機器理解完語音的語義之後往往會和用戶進行對話。但機器內部僅僅儲存文本,比如“今天早上下雨了,記得出門帶傘哈”,這些句子很多都是我們可愛的產品同學加入的,一些可愛的語氣詞,也可以通過智能技術自動生成(另外一種技術:文本自動生成)。將文字轉換為語音回答就涉及到了語音合成技術。語音合成目前也是用的深度神經網絡。


深度視野


多個兩字,意義明顯不同,因為她更像個人了。之前智能還需要手動操作之類的,人工智能,她會有更豐富的功能,更人性化,比如識別,傾聽等,科技含量更高級了!


分享到:


相關文章: