人工智慧什麼時候進化到手機上,隨時隨地可使用?

導讀:AI 技術已經逐漸深入到我們的生活,通過大數據的收集、整理,判斷出邏輯,結合雲與端的計算,讓我們日常使用的設備看起來擁有了“智能”——然而,這只是一系列運算工作相輔相成的結果。

生活場景的真正應用與流暢學習,才是AI深入日常的體現。

那麼,已經成為我們身體一部分的智能手機在人工智能領域到底將扮演著什麼樣的角色?它們已經能夠獨立進行學習,甚至提供類似人工智能等級的服務嗎?

人工智能什麼時候進化到手機上,隨時隨地可使用?

從表面上來看,我們日常使用的智能手機在不少功能的使用上已經相當聰明,比如照片美化可以做到全自動,翻譯功能也越來越逼近人類的語法習慣,甚至連出現在手機裡的廣告都很神奇的符合你的消費習慣。

但這是你手機自己“想”出來的結果嗎?還不完全是。目前,手機在人工智能裡扮演的角色還是偏向於數據收集的功能,甚至連學習都還稱不上。但未來隨著運算架構與製程的演進,加入手機的傳感器類型會不斷增加,及像增強現實(AR)、混合現實(MR)等需要本地端計算能力強大到可以與環境互動的應用出現,由手機自己執行的學習、互動以及更智能化的運算功能也會隨之普及。

當然,雲端的學習與基礎模型建立還是少不了,但本地端的進一步學習,以及對個人化模型的不斷修正,是未來智能設備能不能”更好用”的關鍵。為了滿足這個目的,手機芯片的計算架構選擇與設計也會是重點,目前各大芯片設計公司都已經不約而同往這個方向前進。

人工智能什麼時候進化到手機上,隨時隨地可使用?

目前而言,我們現在所談到的智能應用,幾乎清一色都是套用在雲端上整理、計算來的模型,本地端的終端,比如說智能手機,在機器學習上扮演的角色其實並不是很重要,計算性能較弱,加上功耗預算有限,手機本身能達到的學習機制相當有限。但隨著半導體技術的發展,以及手機應用的智能化以及個人化要求的強化,手機上機器學習能力的強化,也變成未來必走的方向。

一般常見如 Siri、Alexa、Cortana 或 Google Assistant 等語音助理、各平臺上的翻譯服務,郵件服務中的垃圾信辨識功能,以及針對個人包含使用習慣、安全辨識信息以及地圖定位功能等,都不同程度上應用了學習機制,藉以改進精確性與回饋速度,這類型的學習機制也被使用在不少社交網絡以及購物軟件上,來作為判斷消費習慣以及廣告精準投放的依據。

在拍照、相片處理等主流應用中,機器學習也扮演著重要角色。比如說,拍照之後,馬上就能判斷出照片中包含什麼對象,或者憑藉地點以及對象的結合判斷並提供該對象的具體信息。

人工智能什麼時候進化到手機上,隨時隨地可使用?

智能手機已經成為機器學習重要的感官與應用載體

另外,美女們最愛的修圖美顏軟件,也早已經進步到可直接套用機器學習之後的五官、身體特徵模版,讓修圖效果可立即呈現,不必再費時費力手動處理,且合成的效果遠優於手動調整,幾乎可達天衣無縫的境地。

目前,Google 與麻省理工學院聯合開發的照相場景修圖軟件,可在手機上實時預覽拍照場景修圖後的效果,讓用戶在按下拍照按鍵之前,就已經可以先看到拍出來、甚至是修圖後的效果。雖然目前這些效果多半是在色調,或者是高動態光源方面的處理,但這確實可大幅減少事後修改的過程,有效提高拍攝的成功率。

人工智能什麼時候進化到手機上,隨時隨地可使用?

Google 聯手麻省理工學院開發全新機器學習算法,可在拍照前就看到最終拍攝效果

除了拍照功能外,手機遊戲也是智能手機上極為重要的應用,相關市場規模產值非常龐大,2016 年全球手遊產值已經超過 370 億美元。雖然目前主流手遊幾乎都強調在線真人對戰,但實際上,玩家與計算機對戰所佔的時間也不低。很多玩家在跟真人對戰前,都必須先和計算機對戰一番,提升自己操作水平。

但如果計算機對手太“弱智”,一成不變的遊戲流程將對玩家體驗造成傷害。因此各大遊戲廠商已經針對遊戲中的敵人反應進行強化設計,通過機器學習,使其更接近真人。計算機對手甚至可學習翫家的操作模式,自動調整強弱,讓遊戲過程充滿新鮮感,老司機玩家也同樣能感受到挑戰性,藉此將有效提升用戶黏性。

人工智能什麼時候進化到手機上,隨時隨地可使用?

暴雪公司的經典遊戲《星際爭霸》是否會成為 DeepMind 的下一個挑戰目標?

總歸而言,手機目前能做到一定程度的學習,讓應用的表現看起來好像很聰明,但現有的學習模型套用還是相當粗糙——沒辦法針對性的優化體驗,這點除因為應用的類型限制外,手機本身的運算性能還有待強化也是原因之一。目前的應用針對的目的相對單純,但如果未來應用想進展到虛實結合,整合大量信息,並擁有個人化的呈現方式,那相對應的硬件平臺也必須夠強大才有辦法實現。

AR/MR 成敗與否,移動端機器學習是決定因素

理想很豐滿,但現實總是很骨感,這也是為什麼很多人會投入到虛擬的世界當中去追求不同的滿足感,虛擬現實(VR)把人和現實抽離,這對人類的心理會有負面影響,因為無法印證到現實的事物,體驗完VR應用之後的滿足感越高,回到現實世界的空虛感也會更大。但 AR 和 MR 能讓使用者與現實世界進行維繫,透過計算器,讓現實和虛擬可以重迭,現實不足的信息,或感官接觸的缺乏,可透過 AR 的各種傳感器來強化人類的感知堆棧。

增強現實(AR)、混合現實(MR)是通過鏡頭、結合實景與虛擬 3D 建模,將各種實時運算產生的信息畫面迭加在真實景物中,這些實時運算的對象或信息可以和真實世界進行完全的互動,讓使用者用不同的角度去解讀、理解這個世界。這種應用不論是在娛樂方面、產業方面,甚至是軍事技術領域,都有著極為龐大的應用潛力。

但要在手機上實現這些應用,機器學習就扮演著關鍵的角色。不論是在遊戲應用,或者是其他專業領域,AR 或 MR 都包含語言識別與處理、視覺識別與合成等運算工作。隨著各種多功能操控及感官回饋的加入,讓相關計算的工作需求也更為吃重。

與目前流行的拍照應用不同,這部分的體驗與使用者本身,以及使用者身處的環境有極大的關連,無法僅單純套用基本模版。因此,讓智能設備本身擁有的學習能力去針對個人使用習慣來對模版進行相應調整,才能優化整個使用體驗。

人工智能什麼時候進化到手機上,隨時隨地可使用?

電影《鋼鐵俠》堪稱AR應用的經典範例請

過去手機硬件性能不足,限制了這方面應用的發展空間以及效果呈現。然而,隨著半導體與製程技術的不斷升級,還有像 GPGPU(通用圖形處理單元)、DSP(數字信號處理器)甚至 FPGA(現場可編程門陣列)等架構的革新,手機上的整體計算能力幾乎已經可以和桌面端計算機相提並論,且功耗亦可控制在合理的程度,這都有助於推動相關應用的發展。

也因為平臺性能等客觀環境已經相對成熟,走在時代前端的蘋果公司對 AR 生態方面的經營也轉趨積極。蘋果公司的自有處理器設計已是移動應用領域中最強大的架構,性能與功耗皆領先同期同類型的產品。

除硬件平臺設計外,蘋果就生態支持方面,不僅併購眼球追蹤技術商 SensoMotoric Instruments,也在今年 6 月的 WWDC 正式發佈了增強現實開發工具 ARKit,以及包含加速 iOS 設備機器學習能力的 CoreML 機器學習框架,所以我們有理由有可以相信,在蘋果的號召力之下, AR 技術將有機會快速取代 VR,成為未來手機虛擬現實平臺的最主要推動力。

人工智能什麼時候進化到手機上,隨時隨地可使用?

ARKit + CoreML = 移動端 AR 應用爆發?

隨著蘋果加入虛擬現實的戰場,非蘋果陣營在這方面的發展肯定也不會放鬆。由於顯示技術、處理器芯片設計,各家智能機方案供貨商基本上都相差不會太大。因此,要在 AR 市場勝出,關鍵還是在各手機平臺針對個人體驗優化的機器學習設計是否到位,以及能否帶動足夠數量的開發者進入這個市場。

蘋果已經在相關的應用上投入了很大的心力,其他陣營如果不能快速趕上,技術差距將可能被進一步拉大。各家主流芯片設計商對人工智能的想法也存在分歧,移動領域相關產品暫時沒有太多選擇。

ARM 架構獨霸移動方案,GPU 技術以高通均衡性最佳

蘋果加大邁向未來虛擬平臺的步伐,想把非蘋果陣營遠遠甩在後頭,而財力不足的非蘋果陣營卻無法像蘋果一樣不惜工本的設計自有方案,芯片上的每個晶體管的成本都要錙銖必較。能滿足從蘋果,到小芯片設計公司的不同需求,且都基於同一架構,又要能提供不同的自定義架構彈性,在移動方案的架構選擇方面,到現在也只剩下 ARM 一家了。

ARM 在針對人工智能方案方面提供了兩大方向:在 CPU 方面,其最新架構提供了更多元化的核心互連方式,增加芯片的規模彈性以及應用效率;另外一方面,也提供了 GPGPU 運算加速功能,當然,手機上的 GPGPU 運算加速在應用數量或普及率方面仍無法與 PC 平臺相提並論,但硬件已經支持了,未來若 Google、蘋果或百度、騰訊等公司能夠推出標準開發工具包,那麼對此類的運算應用將有可能加速普及。

人工智能什麼時候進化到手機上,隨時隨地可使用?

ARM 與軟銀連手佈局 IoT,欲成為機器學習最大數據供貨商/用戶

當然,ARM 的目標市場其實包含服務器在內的高性能能計算平臺,但 ARM 在高性能計算方面的經驗和市場佈局其實水平一般,但若依靠其在移動應用領域的一家獨大的地位與開發經驗,將相關計算平臺擴展到其他應用領域,並結合更多佈局在 IoT 應用的各類型傳感技術所產生龐大數據,將對 ARM 在機器學習甚至AI技術和市場佈局更有利。

換句話說,機器學習有許多環節,ARM 雖然在高性能計算生態方面不夠成熟,不能站上主要的核心大腦地位,但是機器學習是要有數據源的。ARM 與軟銀結合,分散在各行各業的 IoT 大戰略,目標就是要成為主要的資料供應源。畢竟即便計算架構本身如何強大,若沒有相關傳感設備進行數據收集,也沒辦法構成有意義的資料。再加上智能手機這個最接近使用者的終端,以及未來基於智能手機之上、包含 AR、MR 等各種與現實交互、能提供大量來自各種模擬人類感官的綜合應用,將能滲透各種產業,構成極為強大的生態。

當然,目前所有的移動通訊芯片方案几乎都是基於 ARM 架構,但這些方案其實還是有些不一樣,比如說所搭配的 GPU,或者是 DSP 輔助計算核心的選擇會不一樣,最終呈現出來的效果也會不同。

人工智能什麼時候進化到手機上,隨時隨地可使用?

ARM 與軟銀的 IoT 大戰略

CPU 部分我們略過不談,畢竟都是標準 ARM 架構,即便是定製化,其實也和原版核心相去不遠。最大的差別在於 GPU 和其他訂製架構部分,目前在移動應用上的主流 GPU 架構包含 ARM 的 Mali、高通的 Adreno,以及 IMG 的 PowerVR,從單位能耗來看,Mali 最低,但隨著技術迭代,有逐漸趕上競爭對手的趨勢。

目前,ARM 架構下的所有可選 GPU 方案都支持通用計算,在移動應用中,GPU 的能耗、單位元面積性能表現要比絕對性能更重要,Adreno 與 PowerVR 在同代架構上的效率差距不大。PowerVR 最新的架構 Furion 除了強調能耗,也大幅改良單位元面積性能,單位元芯片面積能輸出的計算性能可以說是移動通訊芯片中可選的性能最強的方案。蘋果雖說要放棄和 IMG 的合作改用自家研發的方案,但下一兩代的芯片不出意外仍會採用 PowerVR。

再來看看高通,其 Adreno 其實佔據了天時地利,其技術來源是當初的 ATI,本身就有不錯的技術積累,且在知識產權方面的掌握度高,而採用 Mali 架構的方案或者是客戶,多多少少都有受到一些專利上的牽制。

目前 PowerVR 與 Mali 都是純粹的貼圖渲染(Tile-Based Render)架構,這是一種延遲著色(DeferRender)技術,但 Adreno 可以針對著色對象的複雜度,自動選擇使用基於 Tile-Based Render 的延遲著色或者是像 PC 平臺 GPU 所普遍採用的直接著色技術,對實際圖形處理性能表現有極大的說明。

人工智能什麼時候進化到手機上,隨時隨地可使用?

智能手機上的可用機器學習硬件設計

不過,目前針對 GPGPU 的通用計算性能還沒有一個比較公正的跑分程序,這方面目前還是要回歸 GPU 本身的面積性能比。但在未來,芯片商或架構提供商所提供的支持要比純粹性能重要,比如說高通針對 Adreno 為客戶提供 GPU 相關 SDK,包含 VR、AR,甚至 GPGPU 計算等等,藉以協助客戶開發相關應用。ARM 也針對 Mali 提供了 VR SDK、Vulkan SDK 以及 OpenCL SDK。其中 OpenCL SDK 就是針對 GPGPU 計算模式開發應用套件,這些做法都可能推動相關應用的發展。

PowerVR 方面也同樣提供了類似的方案,IMG 目前雖苦於被蘋果拋棄的可能性,未來預期收入也可能面臨大幅萎縮,但其大幅降低 GPU 架構授權價格的做法,將有望從非蘋果陣營奪回一定佔有率,從而在一定程度上彌補未來由失去蘋果而帶來的損失。

移動計算乏力,X86 仍將堅守 PC 及服務器市場

Intel 曾經發力移動應用領域,想要從 ARM 的嘴裡搶下市場大餅,但奈何 ARM 的生態太強大,從零組件成本到系統成熟度,再怎麼灑錢追趕也沒有辦法追上,數年之間花了上百億美元,最終也只能放棄。

Intel 的努力化為泡影,AMD 則是苦苦的掙扎求生,根本沒有餘力往移動應用發展,因此兩大供貨商 Intel 與 AMD 在移動通訊的應用領域其實都乏善可陳,Intel 在人工智能領域並沒有強調太多計算架構方面的東西,畢竟其主打還是既有的 X86 處理器。即便是針對海量並行計算與加速方面主推的 Xeon Phi 架構,基本上還是 X86 處理器的升級版,而不是全新架構。

人工智能什麼時候進化到手機上,隨時隨地可使用?

Intel首款集成多核架構產品:至強融核(Xeon Phi)協處理器

Intel 目前通過併購或者是拓展應用,期望推廣自有 X86 架構在相關運算方面普及率。不過針對移動應用方面,Intel 目前並沒有太大的動作,畢竟其前幾年在移動應用方面的嘗試剛被 ARM 打到鎩羽而歸,短期間內恐怕很難看到 Intel 這個名字出現在移動方案領域,尤其是在人工智能相關計算方面。

AMD 雖近來大力改革,也推出不少極具競爭力的服務器、PC 產品,但其營收方面目前才稍有起色,要談到轉虧為盈,甚至往其他領域發展,目前還言之過早。

除了 CPU 和 GPU,我們還能用什麼?

使用現有標準架構來處理相關計算的好處是市場上有極為豐富的生態資源可以使用,不需從頭自己設計輪子,但使用標準架構,會因為架構要求通用性,芯片設計上就要考慮到少數狀況,絕對運算性能也無法專用架構相提並論。

但事情沒有絕對,架構的選擇向來都不是非 A 即 B,我們可以結合不同方向的運算架構在同一芯片或終端上,以彼此搭配的方式,截長補短。當然,主要還是得看針對的應用情境而定。

專用架構的性能表現已經是眾所周知,Google 的 TPU(張量處理單元)人工智能專用芯片架構在 AlphaGO 一戰成名,該設計是自行開發、基於 TensorFlow 框架的計算架構,而 Google 也已經把相關的資源都開源,讓一般開發者可自行調用、開發,未來也將有更多針對移動平臺的架構規劃推出;微軟專門針對 AR 應用開發了 HoloLens HPU,第二代 HPU 也會加入人工智能相關的計算能力。

所以說,如果廠商有足夠的預算和人力,以及可見的市場空間,那麼自己定規格、造芯片會是不錯的方式,除了可以充分了解芯片本身的潛力,也可完全掌握相關的成本結構,不用擔心芯片上會有冗餘的部分造成額外的設計、製造以及功耗成本。

但若是一般中小規模的終端從業者或方案設計業者,可能就很難採取上述方式,此時就必須要使用標準架構,但這麼一來和那些資金充足的廠商之間的差距是不是就無法拉近了?其實也不用擔心,目前針對移動應用的計算加速結構其實還有不少的選擇,即便不自己設計芯片,市場上也可以找到不少現成方案。

人工智能什麼時候進化到手機上,隨時隨地可使用?

當然,一般常見的 DSP、FPGA 都已經相當成熟,也有不少供貨商提供相關方案,不過這些方案在機器學習,或者是 OpenCL 之類的支持方面並不如主流 GPU 那樣積極。所以,採用這類的方案必須要有心理準備。

但以絕對性能而言,這類方案其實不會遜色於 GPGPU,甚至在功耗、性能均衡性方面要有過之而不及。回過頭來看 GPGPU 計算,其在 PC 及服務器平臺上的普及,主要還是 CUDA 與相關生態的推波助瀾,而非絕對性能的優勢。

但必須注意的是 Google 在其移動平臺上大力推廣 RenderScript 這個自有通用計算標準,而不採用 OpenCL,有部分原因是因為芯片方案商所銷售的專用計算加速架構(比如芯片中整合了 DSP 或者其他多媒體計算加速單元)多半都是封閉的,不為開發商提供標準的開發工具包,導致芯片中可能有部分的區塊的利用效率極低,因此造成運算性能的浪費,比如高通過去就是如此。

但不利用既有的成熟開放標準去達到同樣目的,而是採用封閉標準,最後會不會變成芯片商也被 Google 綁架?以後相關計算加速單元的設計都要遵照 Google 的標準?這也是令業界深感憂慮的問題。

RenderScript 有其應用上的優勢,在 Google 的平臺上可以發揮極高的性能,且不同處理器之間的兼容性也很高,不用擔心不同方案商採用的加速架構不同,這一點上要優於 OpenCL。但應用開發上明顯比標準 OpenCL 要複雜不少,且因為是全新的 API,使用者需要時間去學習適應,這可能會拉長應用開發週期。

人工智能什麼時候進化到手機上,隨時隨地可使用?

此外,OpenCL 的好處就是轉換平臺方便,即便是針對 Android 平臺開發,也不用擔心把程序代碼轉換到 PC 或其他平臺上會遇到問題。當然,iOS 就不用想了,蘋果有自己的規矩。

在移動計算平臺上使用機器學習,乍看之下選擇不少,但實際上可用方案比較有限。Google TPU 這類針對性很強的架構,在相對性能上表現肯定是最好的,但相較於 GPGPU 的通用性,可能會有應用彈性較差的缺點。

另外,DSP 和 FPGA 雖也是被業界廣泛採用的架構,但移動計算平臺上的機器學習對這些架構而言還是相當新穎的應用,可能在開發環境方面尚需時日才會趨於成熟。

就目前而言,CPU 與 GPGPU 是立即可用的計算資源,如需要快速投入實戰,這兩種計算架構都可以勝任,但考慮到未來的應用需求以及複雜度的變化,不同類型的架構還是有各自的優缺點。不論是各自使用,或搭配混用,業界應針對應用場景做全盤考量。


分享到:


相關文章: