從科幻影視淺談計算機視覺的走向

在影視業已經相當繁榮的今天,我們經常能接觸到各種類型的科幻影視作品,而且基本上所有的科幻作品中都少不了計算機的影子。所謂科幻也即是科學幻想,是用

幻想藝術的形式,表現科學技術的願景或者社會發展對人類的影響。因而從科幻影視超脫於當代技術的設想中,我們也能夠想象到一些未來科技的走向。

從科幻影視淺談計算機視覺的走向

超能查派

記得在《諜影重重》中曾有這樣一幕:一個特工在眼睛上帶了一個微型智能攝像機,然後攝像機就能自動從人流中篩選鎖定目標,並將目標投影到視網膜上。熱播的 《超能查派》更是讓我們看到了非同一般的科學設想,機器人警察可以準確快速的識別出罪犯。而以上這些科幻的設定都是基於人工智能的高度發展,或者更具體點是計算機視覺技術起到了不可替代的作用。

對人類而言,“認人”似乎是與生俱來的本能,剛出生幾天的嬰兒就能模仿父母的表情;它賦予我們只憑極少細節就分辨彼此的能力,藉著暗淡燈光我們仍能認出走廊那端的朋友。然而,這項對人類而言輕而易舉的能力,對計算機而言卻舉步維艱。過去很長一段時間,計算機視覺技術徘徊不前,在進一步探求前,不如先談談我們是如何用眼睛觀察世界的。

人類獲取的外界信息,主要是通過視覺、聽覺、觸覺、嗅覺和味覺等感覺器官得到的,其中80%的信息獲取都來自視覺,而且視覺獲取的信息也是最豐富最複雜的。人的生理構造決定了我們能夠看清楚並理解身邊的場景,但是要讓計算機看懂這個世界卻是一件非常困難的事情,即使在很多人看來,現在的計算機技術已經足夠先進了,但是要達到看懂並自主分析各種複雜信息的程度,還有很長的一段路要走,所以說計算機視覺這門學科發展到現在,這個發展方向我們是應該明確的。

儘管人眼識別的奧秘已經被逐步揭開,但直接應用於計算機上卻非易事。我們會發現計算機識別總是在“霧裡看花”,一旦光線、角度等發生變化,計算機難以跟上環境的節奏,就會誤識。對計算機而言,識別一個在不同環境下的人,還不如識別在同一環境下的兩個人來得簡單。這是因為最初研究者試圖將人臉想象為一個模板,用機器學習的方法掌握模板的規律。然而人臉雖然看起來是固定的,但角度、光線、打扮不同,樣子也有差別,都令簡單的模板難以匹配所有人臉。

從科幻影視淺談計算機視覺的走向

衛星成像地球

維基百科上對計算機視覺的解釋是這樣的:計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是指用攝像機和計算機代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖像處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。百度百科對計算機視覺也有多種定義,其中形象的定義就是給計算機安裝上眼睛(照相機)和大腦(算法),讓計算機能夠感知環境。

視覺是各個應用領域,如製造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。

作為一門綜合學科,計算機視覺已經吸引了來自各個學科的研究者參與到對它的研究之中,其中包括計算機科學與工程、信號處理、物理學、應用數學和統計學、神經生理學和認知科學等。計算機視覺也是當前計算機科學中的一個非常活躍的領域,計算機視覺領域與圖像處理、模式識別、投影幾何、統計推斷、統計學習等學科密切相關。近年來,與計算機圖形學、三維表現、數字攝影測量等學科也發生了很強的聯繫。

就目前來講,計算機視覺的應用領域主要包括對照片,視頻資料如航空照片,衛星照片,視頻片段等等的解釋,精確制導,移動機器人視覺導航,醫學輔助診斷,工業機械人的手眼系統,地圖繪製,物體三維形狀分析與識別及其智能人機接口等等。

早期進行數字圖像處理的目的之一就是要通過採用數字技術提高照片的質量,輔助進行航空照片和衛星照片的讀取判別與分類。由於需要判讀的照片數量很多,於是希望有自動的視覺系統進行判讀解釋,在這樣的背景下,產生許多航空照片和衛星照片判讀系統和方法。自動判讀的進一步應用就是直接確定目標的性質,電視制導和圖像制導,在導彈系統中常常將慣例制導與圖像制導結合,利用圖像進行精確的末制導。

工業機器人的手眼系統是計算機視覺應用的最成功的領域之一,由於工業現場的諸多因素,與工業機器人不同,對於移動機器人而言,由於它具有行為能力,於是就是必須解決行為規劃問題。隨著移動式機器人的發展,越來越多的要求提供視覺能力,包括道路跟蹤,迴避障礙,特定目標等等。目前移動機器人視覺系統研究處於實驗階段,大多數採用遙控。

從科幻影視淺談計算機視覺的走向

智能機器人

有了以上這些介紹我們對計算機視覺應該有了大概的瞭解了,無論是與哪些學科結合,亦或運用在某個領域,都要求計算機能夠認識這個世界,甚至做出決策。之前主流的觀點是,憑藉著原有的二維攝像頭和完善的算法,就能完整還原真實世界。但是我們都知道,我們生活得世界是三維的,算法就算再完善,在將二維合成三維的過程中也會存在誤差,所以現在讓計算機直接認識三維圖像的研究將逐漸成為計算機視覺的走向。

站在風口上,做豬都可以成功,但下一個風口在哪呢?比爾·蓋茨給出的答案是:計算機視覺(computer vision)與深度學習(deep learning) 的結合。

計算機視覺要做的很簡單,讓設備擁有“眼睛”和“大腦”,像人一樣看懂世界。眼睛好辦,有攝像頭,可是機器沒有大腦,這就麻煩了。從上世紀60年代,研究人員就開始嘗試給機器裝“大腦”。現在有了計算機越來越強大的運算能力做基礎,也可以支撐各種先進的深度學習算法了。

我們在《諜影重重》中看到能夠自動識別並跟蹤目標的智能工具,其實離我們並不遙遠,甚至現在已經有機構研究類似的方面,而《超能查派》中智能的機器警察所需要的則是更加先進高深的深度學習算法,那麼我們是否能夠大膽的說在機器出現自主意思之前,這種可以準確快速識別整個環境包括簡單人類表情,並做出最優的決策響應,就是計算機視覺技術所要研究追求的巔峰呢。


分享到:


相關文章: