01.08 車載語音有遲滯?不怕,AI芯片讓人車交互像聊天一樣順暢

最近幾年,“新四化”(智能化、電動化、共享化、網聯化)可謂汽車行業的風向標。其中,新能源的路線之爭尚無定論,共享概念的推廣困難重重,唯有智能化和網聯化被各大廠商廣泛認可,取得了卓有成效的進步。隨著車機功能的極大豐富,人們越來越重視直接、精準的操作方式,語音控制因而受到了更多認可。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

相比於觸控或按鍵操作,語音控制更貼近人類的使用習慣,將車內交互從“人適應車”變為“人車對話”。通過優化NLU(自然語言理解)並加入NLP(自然語音處理)能力,車機可以提供更為智能的人機交互體驗。特別是對於觸控屏而言,語音控制極大提升了駕駛中操作的安全性,儘可能避免低頭操作而造成視野離開路面的情況。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

最近幾年中,中國品牌加大了人機交互領域的研發投入,在智能化與網聯化方面取得了一定成績。圖為近期推出的新車吉利ICON,搭載由億咖通科技(ECARX)打造的GKUI 19系統。

近年來,中國品牌車型在人機交互智能化方面大做文章,語音識別能力實現了顯著提升,使用體驗相比前些年的產品有了質的飛躍。由於中國品牌對消費者的文化理解更加深入,供應商也大多紮根國內,所以在語音控制方面相比合資或進口品牌有過之而無不及。並且中國品牌車型往往對口語或方言的識別能力更強,不需要太多適應就能順利下達指令。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

GKUI 19系統內置AI智能語音功能,能夠實現對話實時上屏,多輪會話、自定義回覆、聲源定位等,覆蓋50個以上垂類出行場景,並支持包括手錶在內的智能穿戴設備。

不過,複雜的應用場景和繁多的交互功能對語音控制提出了更高要求。目前的主流解決方案是依託雲端的算力對語音進行處理,而云到雲、雲到端之間存在信息傳遞延遲,結果便是交互過程存在一定的滯後,用戶感受不夠流暢。特別是在網絡環境不暢的場景下,智能語音的對話反饋、操作速度會受到嚴重影響,造成不佳的交互體驗。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

為此,億咖通科技與雲知聲通過合資設立芯智科技,攜手探索在智能座艙內充分發掘端的算力以及語音離線處理能力的AI芯片。億咖通科技是是吉利控股集團戰略投資、獨立運營的科技創新企業,專注於汽車智能化與網聯化;雲知聲則是領先的智能語音識別AI技術企業,專注於物聯網人工智能服務。芯智科技作為兩家業界領先企業的合作結晶,融合了雙方的不同特長,實現了車規級適配能力與智能語音識別的高度融合。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

近日,由芯智科技打造的首款車規級全棧語音AI芯片流片成功,有望於2021年實現量產裝車。愛卡汽車與廠方人員溝通得知,這款語音AI芯片採用端雲結合的混合應用架構設計,延時更低,可在複雜的環境下進行語音識別,提高了本地語音識別及語義處理速度。

為了貼近汽車使用場景,該芯片還垂直打通了汽車的數據,增強本地邏輯推理等邊緣計算的能力。在隱私數據方面,芯片引入了本地加密存儲單元,可以更好地包含隱私數據。此外,該芯片的尺寸將顯著小於億咖通現有的E系列多媒體娛樂芯片。

车载语音有迟滞?不怕,AI芯片让人车交互像聊天一样顺畅

具體來看,這款語音AI芯片支持全球 32種以上語言/方言,並帶有全棧語音本地引擎和針對車載場景的本地推理引擎。得益於硬件層面的優化,該芯片內存帶寬利用效率比通用框架提升16-32倍,利用硬件加速算法(FFT等),比DSP計算效率提升13倍。

編輯點評:智能語音控制提升了人機交互的友好程度,不僅有助於提升駕駛安全性,還能夠實現更加直接的操作。近年來,語音控制正逐步替代傳統的按鍵和觸屏操作,在車內交互領域扮演著重要角色。有了車規級語音芯片的支持,車輛離線處理能力將獲得顯著提升,車載語音交互的前景值得期待。

精彩內容回顧:

手機殺手!吉利GKUI 19車載系統微體驗

2019《玩轉車機》合集 沒有什麼搞不定

進軍北美市場 拜騰不惜驚動“地頭蛇”

single


分享到:


相關文章: