AI與AR,可“同進”不可“同退”?

提到AR,你會想到什麼?可以標註物體信息的智能眼鏡,抑或抖音在昨日推出的landmark AR技術?在通常的認知中,AR被普遍認為為應用層新技術或者說是“智能可穿戴設備”,相比人工智能(AI)相對的“算法”標籤,顯得不夠有深度,那AR和AI之間到底是什麼關係?AR屬不屬於當下我們認知中的人工智能?

先來簡單梳理下AR的核心技術。AR(Augmented Reality),是在現實世界中疊加虛擬信息,也即給現實做“增強”,這種增強可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現實的世界和虛擬的世界融合在一起。其中,對現實世界的認知主要體現在視覺上,這需要通過攝像機來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實現對三維世界環境的感知理解,也即是說,AR與視頻也有著千絲萬縷的聯繫。

AI與AR,可“同進”不可“同退”?

目前AR主要的交互方式包括語音識別和手勢識別。語音識別在目前已經取得了較大進展,國內如百度、科大訊飛、雲知聲等都是其中的佼佼者。所以更需要突破的是手勢識別的成熟商業化,比如國內的AI+視頻初創企業極鏈科技便曾在世界人工智能大會上展出過一款線下互動體驗小遊戲,如果AR的手勢識別得以突破,便可以將這種操作方式運用於更多元的方面。

在AR的流程中,有著這樣幾個關鍵點:

首先是3D環境理解。要理解看到的東西,主要依靠物體/場景的識別和定位技術。識別主要是用來觸發AR響應,而定位則是知道在什麼地方疊加AR內容。定位根據精度的不同也可以分為粗定位和細定位,粗定位就是給出一個大致的方位,比如區域和趨勢。而細定位可能需要精確到點,比如3D座標系下的XYZ座標、物體的角度。根據應用環境的不同,兩種維度的定位在AR中都有應用需求。在AR領域,常見的檢測和識別任務有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。

在感知現實3D世界並和虛擬內容融合後,需要以一定方式將這種虛實融合信息呈現出來,這裡面需要的就是AR中的第二個關鍵技術:顯示技術, 目前大多數的AR系統採用透視式頭盔顯示器,這其中又分為視頻透視和光學透視,其他的代表有光場技術、全息投影等。

AI與AR,可“同進”不可“同退”?

AR中的第三個關鍵技術在於人機交互,用以讓人和疊加後的虛擬信息互動,AR追求在觸摸按鍵之外自然的人機交互方式,比如語音、手勢、姿態、人臉等,用的比較多的語音跟手勢。

人工智能和AR的技術關聯:

在人工智能領域有幾個概念常被提及,如深度學習、機器學習,在學術領域包括人工智能在內幾大領域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智能,涵括所有“讓機器像人一樣”的技術的應用方向。

深度學習是實現機器學習的一種技術方式,而機器學習是為了讓機器變得智能,去達到人工智能。可以說人工智能是最終目標,而機器學習是為了實現這個目標延伸出的一個技術方向。在這其中,還有另一個重要概念為計算機視覺,主要來研究如何讓機器像人去“看”,是目前人工智能概念中的一個重要分支,這也是因為人類獲取信息最主要的方式之一就是視覺,目前計算機視覺已經在商業市場發揮價值,比如人臉識別;自動駕駛中讀取交通信號和注意行人以導航;工業機器人用來檢測問題控制過程;三維環境的重建圖像的處理等等。這些概念既有區分也有一定範圍的重疊。

AR究竟是不是人工智能:

對AR從業者來說,理想的狀態是用更智能的AR終端去取代智能手機,所以對於用戶來說接觸使用AR首先受影響的是內容,其次是終端,AR產業鏈如果粗暴劃分包括技術提供商、智能終端研發公司,以及AR內容提供商。在這其中,AR設備提供商不可避免關注硬件技術,如底層的芯片、電池、光學鏡片等,以及硬件本身的性能優化,而內容提供商更傾向於在現有技術基礎上優化內容及表現。所以我們可以說AR技術提供商,或者說在底層算法研發上有一定成績的AR公司是人工智能公司。

AI與AR,可“同進”不可“同退”?

對公司來說,特別是創企會把底層技術轉化為成熟的產品或服務,這可能是如無人機、AR智能終端、機器人等,也可能是行業解決方案,以達到商業目的,並且這已經成為在沸騰聲音之後,媒體、企業以及大眾對AI企業的期待和要求。

小結:

作為技術驅動的商業領域,無論是AR還是人工智能的其他多數方向,技術距離完全成熟還有很長的路程要走,在整個產業鏈逐漸繁榮,關注商業化實現的同時,也需要有更多如曠視科技、極鏈科技一樣的公司機構去不斷拓展技術邊界,建立核心競爭力,讓行業爆發更大的價值與潛力。如此一來,AI時代中國彎道超車當可期。


分享到:


相關文章: