Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

6月26日,國內知名的人工智能公司Rokid(若琪)在杭州舉辦“2018 Rokid Jungle”發佈會。雖然在此之前,Rokid曾發佈過Rokid Alien、Rokid Pabble兩款智能音箱產品,但是這次發佈會卻是Rokid成立4年以來的首場大型公開活動。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid創始人兼CEO Misa(祝銘明)在會上發佈了三款重量級新品。除了Rokid Me便攜智能音箱以及Rokid AR Glass這兩款智能硬件產品之外,Rokid還發布了KAMINO18 語音AI專用芯片。

便攜智能音箱Rokid Me

此前市場上雖然有眾多的智能音箱產品,但大都是針對家庭使用場景設計的。而此次,Rokid針對年輕人群打造了一款便攜智能音箱Rokid Me。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid Me採用航空鋁材質一體機身和獨特的雙面圓弧造型,擁有銀、粉、藍、紫四款色彩。同時內置了若琪語音助手和6個麥克風陣列,能夠實現360度5~10米遠場拾音。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid Me還搭配有4000mAh大電池,能夠保障8小時以上的連續使用。

在功能設計上,Rokid還獨具匠心地在Me這款產品上,創造了搖一搖切歌,翻轉暫停的手勢交互操控。

特別值得一提的是,Rokid Me之所以採用航空鋁材質一體機身,是因為航空鋁材質非常的堅固,一方面可以使得Rokid Me更加的抗摔,另一方面也使得Rokid Me即使在高音量的情況下機身也不變形,所以全部的聲音會傳導給揚聲器,這也可以保證高保真的音質。

對於Rokid Me的音質,Misa非常自信的表示:“我敢向你們保證Rokid Me在音質上不輸一些專業的音箱,因為我們採用了專業音箱一模一樣的技術再加上智能,所以Rokid ME是非常典型的以音箱為核心訴求的一個產品,而不是以所謂的智能。”

另外,為了讓用戶能夠更好的與Rokid Me進行交互,所以Rokid做了非常獨特的聲學設計,將麥克風和揚聲器都做成了直接朝上的設計,使得Rokid me跟用戶之間交互可以非常直接,不受任何干擾。但要完成這一點對工程、軟件、算法及整個技術提出了巨大的挑戰。揚聲器與麥克風之間只有1釐米的距離。

Misa也坦言:“我們為此做了巨大的努力,但我們犧牲了一些東西,比如在2到3米內的遠場識別效果很好,距離遠可能會差一些,但這個產品本來就是一個隨身的產品,所以你就犧牲這些,這是Rokid對產品的理解。”

對此,MIsa表示“我們的東西的確不便宜,不過Rokid Me的799元的這個價格是包含了2年的QQ音樂服務,而且參加預購的用戶還能額外享受1年喜馬拉雅巔峰會員的獨家權益,其實是非常划算的。同時,我們想要給用戶的也是最好的東西,而不是是塑料的非常LOW的材料,非常糟糕的設計,非常糟糕的品質,最後你只是可以用。但我相信現在,尤其是年輕人,Me就是為年輕人設計的,一定會選符合他自己品質的東西,這是我們一直的觀點。”

來自未來的Rokid Glass

早在2012年4月,谷歌就曾推出一款炫酷的AR眼鏡Google Glass,它具有和智能手機一樣的功能,可以通過聲音控制拍照、視頻通話、發信息、導航以及上網等功能。2014年穀歌又推出了第二代的Google Glass。但是最終,這款產品還是走向了失敗,沒有走向量產。

究其原因,一方面可能是由於體驗相對較差,雖然Google Glass比較輕便,但是實際上,它採用的是分體式的設計,其眼鏡仍需要連接到一個盒子,也就是其“大腦”,才能工作。另一方面則是由於其高昂的售價,以及缺乏生態。還有一方面則是引發的用戶對於其侵犯隱私的擔憂。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

在此次發佈會上,Rokid推出了號稱“目前全球可穿戴性最強的AR一體眼鏡”——Rokid Glass量產版。相對於今年1月在CES上公開亮相的Rokid Glass原型機來說,經過 5 個多月的研發,Rokid Glas量產吧採用了全新的設計、更為輕巧、功能也更加強大。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid Glass量產版延續原型機的一體化設計,整體體積縮小40%,採用合金邊框取代之前的塑料材質,美觀且更好的散熱。在人體工程學方面,Rokid Glass 可適應 90%以上用戶的頭型和瞳距,吸附式矯正鏡片讓近視用戶也能夠正常佩戴。整機質量輕盈,重量120克,僅為微軟HoloLens 的1/4。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid Glass擁有全球領先和獨創的單鏡片 AR 光學技術,將光效率較傳統方式提升 50%,全綵全高清的 OLED 微顯示屏,其光學分辨率為1280x960,刷新率 60fps,視場角大於30度,大畫幅顯示,讓視覺更加逼真,相當於看一個5米以外的110寸電視畫面。

硬件配置方面,Rokid Glass採用高通驍龍 835 處理器,擁有強大的計算處理能力。眼鏡上方搭載了一顆 1300 萬像素帶光學防抖的攝像頭,讓遠距離視覺識別、二維碼掃描更加方便快速。

除此之外,Rokid Glass支持人臉識別功能,官方稱其識別準確率高達99.7%,可應用於社交、安防、醫療等領域。比如,通過Rokid Glass拍下一張名片以及對應的人的人臉圖像,那麼下次再見到這個人是,Rokid Glass就會提示這個人的個人信息,這對於具有“臉盲症”的職場人士來說簡直是福音啊!

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid CEO Misa與首席設計師兼美國產品研發負責人姜公略現場演示Rokid Glass的人臉識別

同時,Rokid Glass還支持物體識別。商家只需上傳多張不同角度的商品圖片即可,還能添加視頻、動態圖片、評論等多媒體素材,用戶就可以利用Rokid Glass對商品進行識別,讓線下購物體驗更加豐富。Rokid Glass利用 WiFi 定位技術,可實現商圈內部一米範圍內的精準定位,解決商超內室內導航這個痛點。

另外,在操控方面,Rokid Glass支持語音操控和觸控式操控(眼鏡腳側邊有一個小的觸摸板)。

在此前Google Glass備受爭議的公共隱私問題方面,Rokid首席設計師兼美國產品研發負責人姜公略表示:“我們現在做的設計是將攝像頭藏在裡邊的,這是第一點,不會讓人覺得可能被侵犯,而不願意接近。另外,我們在邊上還會加一個非常小的LED燈,所以在拍照和錄像的時候別人是知道的,日本所有的手機在拍照的時候都要求要有聲音,我們還要面對國際市場,所以我們在這一點上必須做到。”

對此,筆者認為其實可以採用AR場景識別以及定位等措施,在一些敏感的公共領域,禁止用戶去啟動這個功能,就像針對無人機的電子圍欄一樣,這樣可以更好的避免一些隱私問題。對於筆者的這個建議,Rokid方便也表示後續會考慮。

在生態建設方面,為了方便開發者進行行業應用開發,Rokid Glass搭載 Android 7.0 系統,4G 內存,64G 存儲,可自定義安裝各種開發工具包,可廣泛應用於室內/外導航、線下購物、社交、遠程協助、旅遊、展覽、教育、工業 4.0 等行業及場合。

Rokid創始人兼CEO Misa 表示,Rokid Glass是目前全球可穿戴性最強的AR一體眼鏡,承載了Rokid在硬件,光學和人工智能領域的技術積累,也是Rokid在人機交互技術探索上的一次飛躍。此次發佈的Rokid Glass將於今年四季度正式量產。

但是對於產品定價,Rokid方面並未透露,只表示會控制在與旗艦手機相當的價格。另外,Misa還表示,今年可能市場上還買不到Rokid Glass,因為產能已經被一些特定渠道的客戶給定完了。

語音AI專用芯片KAMINO18:已接到百萬片訂單

隨著今年“中興事件”的爆發,引發了國內整個行業對於“自主芯片”的重視。一時間,一大批的企業紛紛宣佈進軍半導體領域,要自己做芯片。其中,就包括很多的人工智能(AI)算法公司。

不過,相對於一些為了“玩概念”而跨界進入芯片領域的廠商來說,AI算法公司推出自己的芯片則是一件很自然的事情。因為,AI算法的實現需要依賴於芯片,而不同的算法對於芯片的需求也是不同的,對於特定算法,專用型的AI芯片的加速要遠遠優於通用型芯片。這也是為什麼AI算法廠商大都有自己推出或者聯合芯片廠商推出定製化的AI芯片。

比如,今年CES期間,聲紋識別技術廠商Speakin就曝光了自己的一款聲紋識別芯片和模組(詳情可參看:《智能語音助手設備大熱,全球首款聲紋識別芯片及模組曝光!》)。今年5月,語音識別廠商,雲知聲也推出了自主設計研發的第一代UniOne物聯網AI芯片及其解決方案雨燕(Swift),可支持多種深度神經網絡模型,官方稱其性能較通用方案提升超50倍。

強大的KAMINO18

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid 北京AI-Lab負責人高鵬博士介紹KAMINO18

此次,Rokid發佈的AI語音專用芯片KAMINO18,是一款針對AI語音設計的SoC芯片,內部集成了ARM Cortex-A7內核、NPU、DSP、MEMORY、DAC等眾多元器件。SoC的設計大大提升了芯片整體集成度,大小僅與一元硬幣相當。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

從與下面這張圖上的五麥克風陣列的AI語音模組對比,我們可以看到,KAMINO18確實是非常的高度集成,其將大部分的關鍵元器件都整合到了SoC當中,外圍大幅精簡,只需連接MIC即可。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

另外,KAMINO18還內置了眾多Rokid自研的先進語音交互算法:包括相控陣技術、CTC模型、自定義喚醒詞、離線語音指令、低功耗喚醒等算法。

以語音指令為例,其可以實現在沒有網絡的情況下也可以通過簡單的“開燈”、“關燈”、“播放音樂”等不需要網絡的指令來操縱智能家居。據介紹,Rokid的研發人員還在持續開發基於Kamino18的新的AI功能,如離線語音合成、離線聲紋識別等,來充分發揮此芯片的威力。預計7月聲紋識別功能就會上線。

而KAMINO18當中最核心的部分就是NPU,其可以同時對不同的算法模型進行加速運算,並且可以並行處理不同模型。還可支持通過軟件來進行擴展,支持TensorFlow等。

內置的DSP,可以對回聲消除、自動增音控制、降噪等複雜的音頻算法進行處理。同時SoC還支持6 MIC陣列、I2S、PDM等輸入。從硬件上來說這顆芯片能夠滿足絕大多數場景下智能語音設備對硬件的要求。

在性能方面,據Rokid北京AI-Lab負責人高鵬博士介紹介紹,KAMINO18能夠保持在提高性能的同時功耗降低50%以上,同時集成度也可以提高30%以上,成本也可以降低30%以上。在複雜場景下的性能表現也得了極大的提升,並能夠支持更多的離線功能。

高鵬博士非常自豪的表示:“如果要給Kamino 18下一個定義的話,那麼可以說這是一顆全能之作的芯片,它內置了全部的語音AI算法功能,並具有高性能、高集成度、低功耗和低成本的明顯優勢。”

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

另外,針對海外市場,KAMINO18也即將支持Amazon Alexa。據Misa介紹,未來基於KAMINO18的智能語音設備可以同時支持Rokid的中文語音服務和亞馬遜Alexa的英文語音服務。當用戶用英文交流時就會連接亞馬遜服務,當用戶用中文交流的時就會連接Rokid的服務。

與杭州國芯的合作

不過,值得注意的是,KAMINO18是由Rokid和杭州國芯合作完成的。

去年10月,杭州國芯就曾在深圳發佈了兩款語音AI芯片GX8010和GX8008。那麼此次Rokid的KAMINO18是否就是採用的其中的一款芯片呢?

在隨後的專訪環節,Rokid創始人兼CEO Misa則表示KAMINO18是由杭州國芯為Rokid定製的。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

Rokid創始人兼CEO Misa

Misa解釋稱:“我們今天的芯片跟過去理解的芯片不大一樣,今天基本是SoC,而SoC裡邊有90%的東西都是很成熟的,Rokid沒有必要花精力去做各類IP,所以我們關注的則是如何利用現有的IP來進行組合,如何融入Rokid的算法,如何在SoC架構層面進行優化等等。Rokid跟國芯的合作,我們是從OS層面到整個算法層面,一直到指令集,到優化層面,全部由Rokid提供,來幫助做的。”

那麼Rokid的KAMINO18與雲知聲的AI芯片雨燕(Swift)又有何不同之處呢?

Misa表示:“與其他語音AI芯片相比,Rokid的這款芯片最大的區別是,我們是一個完整的系統級解決方案,Rokid的芯片必須能夠保證跑一個完整的OS,將所有的內容都可以完整的跑起來,所以它一定是非常強大的。比如雲知聲的AI芯片更偏向控制,而我們更偏向AI,所以我們的芯片是一個完整的東西,不簡單只是一個語音的信號處理,而是能夠處理一些複雜邏輯,包括用戶的體驗等諸多的東西。因為我們的產品是高度複雜交互性的產品,所以我們要做更強大的芯片,面向的場景也不同。目前高集成度、高性能的語音AI芯片的只有我們,其他大多是做非常前端的。”

做一個“分享者”

過去很多人認為Rokid是一家做智能音箱的公司,而此次KAMINO18的推出,又使得不少人認為Rokid將會成為一家AI芯片公司。但是實際上,Rokid是想通過AI芯片將自己的能力“分享”出去,做一個“分享者”。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

“Rokid從第一天起就不是一個智能音箱公司,我們現在也不是芯片公司,只不過芯片會成為我們非常有競爭力的元素。”Misa認為:“Rokid是一個探索者,我們一直在不遺餘力地做探索,我們希望將該趟的坑、該冒的險,通過自己來落地,而不是將這種風險轉遞給合作伙伴。當我們完成探索和完成自己的認證之後,Rokid的分享者的角色就開始產生,我們會將對產品的理解、對技術的理解,對用戶的理解、對市場的理解以及對整個行業和生態的理解分享給合作伙伴。而打造AI芯片則使得我們具備了能夠提供一整套的解決方案的能力。”

正因為Rokid希望做一個“分享者”,所以在這款AI芯片的商業模式上,也不同於其他的AI芯片廠商。

在專訪環節,Misa也明確的表示:“Rokid不通過芯片賺錢,甚至我們都不直接單獨賣芯片,Rokid做芯片也不是以做芯片為出發點的,因為對我們來講,做行業的人都知道芯片的利潤特別低,只是因為市面上沒有我們需要的,所以我們來做,如果市面上有我就用它。另外,我們也不賣模組,因為KAMINO18是高度集成的,沒有模組,只有少數外圍器件。我們是給用戶提供一整套的解決方案。當然,客戶也可以根據自己的需要進行選擇。我們會給大家充分的想象力跟自由度去打造自己的產品,這就是Rokid。”

KAMINO18已拿下百萬顆訂單

衡量一塊芯片成功與否的標準是看它能否大規模的應用於產品。據介紹,Rokid Me的量產版就將會搭載KAMINO18。

另外,據高鵬博士透露,KAMINO18在尚未出貨的情況下,就已經獲得了行業內其他合作伙伴的認可和一定規模商業合作。

Rokid發佈首款語音AI芯片,剛量產就拿下百萬片訂單!

在當天的發佈會上,喜馬拉雅FM副總裁李海波先生也宣佈了與Rokid的深度合作,雙方將合作基於KAMINO18打造一款兒童音箱——曉雅mini。

除了與喜馬拉雅的合作之外,在會後的專訪環節,Misa還透露Rokid很快將會與NXP達成合作,不過具體合作內容,Misa並未透露,筆者猜測可能是在AI芯片方面的合作。

而更為驚人的是,KAMINO18目前已經拿到了百萬片的訂單。

“Rokid的芯片是量產型的,而不是隻表現在PPT上的。”Misa非常自豪的表示:“我們的KAMINO18已經定下的就有超過幾百萬片了,所以大家完全不用擔心客戶方面的問題。”另外,Misa還透露未來Rokid的AI芯片還會加入機器視覺方面的能力。

最後,Misa強調:“Rokid不是一家做智能音箱的公司,而是人機交互技術公司。我們在北京、美國設立研發團隊,所有的研究都圍繞未來人機交互的環節。我們的核心目的是探索新的交互方式和交互體驗。當然,人機交互最重要的一個環節就是AI,所以我們會用AI技術來做人機交互的探索。”


分享到:


相關文章: