方寸指尖
現在AI智能音箱都是集成了語音增強版芯片和增強版的MIC系統,從本質而言和普通的手機、平板等智能設備並沒有太大差別。從核心技術而言,在底層主要是由芯片廠商來提供,而在具體的產品生產和配套軟件、AI智能服務等技術都是音箱廠商自己來做。科大訊飛主要是提供語音識別技術軟件,並不是所有AI智能音箱廠商會採用訊飛的方案,畢竟能夠做語音識別技術的公司還有很多。
一、AI智能音箱核心的智能芯片和底層軟件都是由芯片廠商提供的。現在主流AI音箱芯片主要有:
1、聯發科MT8516
聯發科手機芯片在高通的打壓之下處境艱難,但在AI音箱芯片市場,聯發科卻揚眉吐氣了一番,據悉2016年AI音箱市場近80%的芯片都是由他們供應的。聯發科是亞馬遜AI音箱Echo的主力芯片商之一,佔據了過半的份額。另外,聯發科還是Essential Hom(Android之父Andy Rubin新公司推出的“智能助手”)、阿里的天貓精靈X1的芯片供應商。
MT8516支持四核心64位ARM Cortex-A35,主頻達1.3GHz。該芯片還內建WiFi 802.11 b/g/n 和藍牙 4.0,不僅確保芯片更小的佔板面積,更有助於終端廠商簡化設計、加快上市時間,併為開發更多的創意性產品提供了更多可能。MT8516支持高達8通道的TDM麥克風陣列接口和2通道的PDM數字麥克風接口,非常適用於遠場(Far-field)麥克風語音控制和智能音響設備。
2、高通Smart Audio Platform
高通在智能音箱芯片領域不甘示弱,推出旗下的“智能音效平臺Smart Audio Platform”。在這個平臺上,高通提供了兩款新的系統級芯片(SoC),基於驍龍 425(APQ8017)芯片和驍龍 212 芯片(APQ8009)做的,針對音頻處理優化過。。兩款新芯片將提供對兩個語音助理的支持,Google 助理和亞馬遜的 Alexa;也能支持語音識別、網絡電話(VoIP)。
3、英特爾Smart Home Hub
在亞馬遜開發者大會上,英特爾表示將會開發基於亞馬遜Alexa的“Smart Home Hub”(中文意思為“智能家庭中樞”)的智能音箱。英特爾推出的原型參考設計將會幫助外部的硬件廠商加速開發各種基於Alexa的語音設備,並且採用英特爾的芯片平臺。據介紹,這款智能音箱將會支持豐富的網絡連接方式,包括Wi-Fi、Z-Wave、Zigbee、藍牙等。
4、全志科技R16芯片
早在2015年,京東推出的集成科大訊飛的語音助手的智能音箱叮咚就採用的是國產芯片廠商全志科技的R16芯片(Cortex-A7四核架構)。科大訊飛推出了4+1環形五麥克風陣列,也是採用的全志R16平臺。
全志R16採用了四核ARM Cortex-A7架構處理器,具有強大的運算性能和豐富的接口;支持基於Linux的開源系統Tina,(Tina是全志科技全力打造的專門用於全志智能硬件平臺的系統軟件品牌);支持AirPlay、DLNA、Qplay、Airkiss、Smart Link等多種網絡應用協議;提供獨特的算法、IP包,使開發者可以專注於其自有應用和產品市場運營,降低產品開發成本,並縮短開發週期。
5、瑞芯微RK3036、RK3229
2017年4月,瑞芯微電子在香港電子展上公佈了旗下兩款“AI語音助手”芯片級解決方案:RK3036與RK3229兩顆芯片,分別針對入門級與中高端產品的語音智能音箱方案。並且在今年一季度已經開始出貨。5月17日,谷歌I/O開發者大會上,瑞芯微電子(Rockchip)率先向全球發佈基於Android 系統平臺的RK3229谷歌語音助手(Google Assistant)解決方案。
RK3036基於Cortex-A7雙核,支持1/2/4Mic; RK3229基於Cortex-A7四核,支持4-8Mic。在語音算法上,支持聲源定位、聲源增強、回聲消除、噪音抑制技術。RK3229還是率先支持8路數字I2S數字硅麥直連的芯片方案,不僅大大節約成本,而且兼容不同麥克風陣列算法及平臺。
6、紫光展銳——RDA5981
紫光展銳的市場腳步也很快,目前搭載該公司芯片的智能音箱產品已經大規模出貨,開始大力收割300元以下的低端智能音箱市場。在媒體的一次報道中,展銳的發言人表示:“目前我們的音箱客戶大概有幾十家,主要是300元以內的智能和藍牙音箱,芯片價格成本很有競爭力。
銳迪科的RDA 5981,採用40奈米制程、內建ARM Cortex-M4處理器,是一款為智能家居、智慧家庭、智能語音交互等物聯網打造的全集成低功耗的WiFi芯片。.
7、蘋果A8
蘋果發佈了集成Siri的智能音箱HomePod,它將作為一箇中心串聯起整個蘋果智能家居。蘋果的產品就是任性,HomePod內置強大的A8處理器,它的運算速度實際上就和iPhone 6一樣,因而能夠出色地完成聲場設置、降噪和語音識別工作。HomePod的底部配置了7個陣列式精密波束音腔,並採用SIRI進行語音交互。
從性能而言蘋果的AI音箱芯片是最強大的,但只是提供蘋果自己使用。
從AI智能音箱的芯片來看,很多芯片廠商提供了完整的軟、硬件技術平臺,一般即使是比較小的音箱廠商都可以快速生產出AI智能音箱產品,大大降低了智能AI音箱的進入門檻。
二、AI智能音箱廠商主要負責產品的製造和技術支持
從智能AI音箱的供應鏈可以看出,語音服務、芯片、麥克風陣列方案等底層技術全面有專業公司在做,技術實力較弱的廠商可以直接採用芯片廠商提供的完整的軟硬件解決方案進行生產,而技術實力較強的廠商,在內容和智能AI服務方面都加入了自己的核心技術。現在的AI音箱市場魚龍混雜,即使現在主流的產品都難言是真正的AI音箱,更像是語音助手。隨著技術的進步,未來AI音箱也將迎來更迅猛的發展。
智慧新視界
1、首先糾正一下:你說所的不叫語音助手,而是叫做“智能音箱”。
2、問題的答案是:是的。
3、智能音箱由 作為硬件的音箱本身+作為軟件的智能語音助手(時刻保持在聯網狀態下) 構成。
硬件部分就如同一部手機,有各類配件組成,可能會在設計方案上有所區別,但基本上這個不是太有必要去做比較,因為所有的重點和難點其實都在軟件的智能語音助手上面。
4、智能語音助手(軟件)=大數據+算法+運算力/資金實力
這個公式決定了智能語音助手只是小部分公司能玩的遊戲。
其次算法(含自然語義)是第二大門檻:智能語音助手需要識別的是國內幾十個不同民族的語言中所有可能的場景下的所有語言中含有的信息,方言的識別、自然語義的分析是最難的部分,因此沒有大數據提供的關於人的生活、使用手機、語音或文字聊天的行為等所有的充分數據的支持,自然語義的算法開發是做不到的。(我在2014年和北京的一位提出“國家智能”的學者請教和探討過這個問題)
綜合以上:別看這智能音箱小小的,而且價格高低都有,它背後代表著的說白了是一家互聯網公司的“實力”,同時也意味著智能生活的時代的到來。