愛犯錯的智能體 – 視覺篇(三):看不見的薩摩耶

家附近曾經有隻白色的薩摩耶,大約十二歲,挺安靜溫順的,基本不怎麼吠叫。聽說主人身體不好,有人癱瘓在家,於是就放任其在外亂逛。他雖然個頭不小,馬路什麼都過的好好的。可今年某天他過人行橫道的時候,一輛左轉的車輛速度和它過馬路的速度一致,導致它進入了駕駛員的A柱盲區。等薩摩耶反應過來時,車已經對著它衝了過來,左前輪壓了一次,左後輪又壓了一次……它躺在車後,無助地顫抖著、哀嚎著。兩旁的行人呆呆地看著,我也是……車主坐在車裡,沒開窗沒下車,不知道是何反應。過了一會,狗用力翻身站了起來,搖搖晃晃走起來了,準備回家。大家鬆了一口氣,有人笑著說狗沒事了。車主也順便一溜煙開車跑了。可是,狗沒走到200米,便慢了下來,實在是走不動了。它的左眼珠早已被汽車壓得爆了出來,滿嘴的鮮血……於是,它便安靜地躺在人行道上,還像平日逛街一樣,一聲不吭……希望它下輩子,不要走得這麼悲慘。

作為智能體,人的視覺和現在的機器視覺是有區別的。其中一個非常特別的區別是,人會根據情況或上下文有意無意地忽略眼中看到的目標。

1999年兩位權威心理學專家克里斯托弗·查布里斯(Christopher F.Chabris)和丹尼爾·西蒙斯(Daniel J.Simons)曾做過一次“看不見的大猩猩”的實驗。

因為這個傳說中心理學史上最強大的“大猩猩實驗”,兩人因此榮獲了2004年的“搞笑諾貝爾獎”。在實驗中,幾個人一起打籃球,要求測試者統計投進籃框的球的數量。當要測試者報告進球數時,基本都答對了。但問他們有沒有注意到有隻人扮的大猩猩從視頻中走過,卻有不少人沒能回想起來。

類似的實驗,英國赫特神德大學的心理學怪才、理查德·懷德曼教授(Richard Wiseman)也做過,叫變色紙牌遊戲。

兩個人在攝像機前表演玩牌的魔術。表演的過程中,身上的衣服、背景、桌布都被換掉了。但由於攝像機關注焦點的變化,觀測者只注意了兩位“魔術師”手中撲克牌的變化,而已經換掉的材料卻壓根就沒發現。

如果讓計算機或利用人工智能算法來跟蹤並區分變化內容,會很快發現其中的區別。因為計算機在檢測目標時,會考慮像素位置上的強度變化。所以,當視頻中出現大猩猩,或者變換桌布、背景、衣服時,都意味著視頻幀與幀之間出現了大面積的像素變化。這種變化,很容易超過圖像變化程度的閾值, 導致被檢測和發現。值得指出的是,檢測這類變化也是現在做視頻摘要、視頻關鍵內容提取的基本手段之一。

反觀人類,人卻容易出現忽略目標的情況。其原因在於,當人關注某個目標時,目標將成像於視網膜的焦點即中央凹區域,而目標周圍的內容則分佈在中央凹的周邊,由視杆細胞來負責感知。而視杆細胞主要負責運動,對具體細節不敏感,所以,大猩猩在這一前提下就被大腦視覺中樞視為沒有多大意義的像素點運動,甚至被籃球的運動所掩蓋。換衣服、桌布等也是類似的原因。

除此以外,也許是因為人類其實是一種能偷懶就會偷懶的智能體。如果能夠在不經過縝密思維就能保證大部分判斷成功的話,人類會傾向於優先採用更簡易的判斷,而不是進行過多的細緻分析。就像平時走路一樣,我們也沒有像機器人一樣去區分路面的高低差異、紋理差異、光強差異,但卻能非常有效和快速的形成決策。即使存在例外,那也是極個別的情況。

這種現象,在日常生活中,是比較危險的。比如交通中,在一個平時很少有人經過的十字路口,駕駛員的關注焦點將是行駛的汽車,其關注點以避讓汽車為主。在成年人經常走過的人行橫道附近,則駕駛員的關注視角會以成人為主。前者的情況會導致,某天突然出現非機動車或行人時,司機會注意不到,不容易形成應急反應;後者則可能會忽略對矮小目標的關注。

能避免嗎?有心理學家指出,如果關注的焦點不變,這種定式思維會一直存在,且很難避免。結果,當駕駛員發現危險來臨時,已經缺乏足夠的反應時間,極易形成交通事故 。

那如何解決呢?最簡單的辦法就是不要在經常經過的這些路口形成定式思維。但凡碰到這類路線時,不妨想想,這裡可能有條看不見的薩摩耶。不妨多變化下關注的視野,如轉下頭、變換下關注的視野,最大程度地避免這類事故的發生。

二、看不見的盲點

人的視覺不僅有視而不見的特點,也有彌補先天不足的能力。我們的視神經感受周圍環境後,還需要將信號送到大腦。送的方式挺聰明,大腦將輸送信號的神經元像頭髮一樣紮成一股,左邊一股,右邊一股,在每個眼球視網膜中央凹偏外約20度處集中起來,向大腦輸送信號。於是,這個位置就沒有感光細胞,形成了生理性盲點,如圖1所示。

愛犯錯的智能體 – 視覺篇(三):看不見的薩摩耶

圖1:人眼構造,視神經傳輸位置沒有感光細胞

愛犯錯的智能體 – 視覺篇(三):看不見的薩摩耶

圖2: 生理性盲點測試圖

要檢測盲點的具體位置,不妨試試圖2這個經典的盲點測試圖。首先,捂住左眼,用右眼盯著圖上的圓點,將手機逐漸拉遠或拉近,會發現在某個位置時十字會消失。這個位置,對應於你的右眼盲點。類似的,捂住右眼,用左眼盯著右邊的十字形,移動手機遠近,會發現圓點在某個位置消失了。它對應於左眼的盲點位置。

雖然有盲點,所幸人是雙目視覺,所以兩隻眼睛的盲區會通過雙目視覺來相互彌補。結果,日常生活中,人是感覺不到盲點的存在。不過,如果單眼存在眼疾,如患上白內障,那盲點的影響就比較大了,畢竟有個位置的信息是缺失的,這就需要通過多調整視角來消解這個困擾。

三、看不見的筆 -- 單眼與複眼

除了盲點外,還有種情況,人也會對目標視而不見。各位不妨試著拿起一支筆,豎直放在左眼前面。 一開始,你會感受到筆對視野造成的遮擋。再將眼睛盯著遠處某目標,將筆緩慢遠離眼睛,你將會發現這隻筆並沒有對你看遠處的景像形成任何障礙,筆似乎憑空消失了。顯然,這並非是生理性盲點造成的。它和人的視網膜結構有關。換句話說,它可以從單眼與複眼的關係來解釋。

眾所周知,人有兩隻眼睛,而昆蟲則是由非常多的小眼睛組成的,俗稱複眼,如蜻蜓、蒼蠅都有複眼。如果是昆蟲的複眼,那麼筆是不會對想觀測的目標形成遮擋的。因為昆蟲的整體視覺是可以通過小眼睛的視角拼接而成,少數幾隻眼睛的被遮擋不影響全局。可是人是雙目視覺,為什麼也會有類似的情況呢?實際上,人的視網膜上的感光細胞數量眾多,每個細胞都分擔了一部分的視覺檢測。在處理筆遮擋的任務時,也會通過感光細胞間的相互填充,實現類似複眼的功能。

但要注意的是,人是不可能像昆蟲那樣演化出複眼的。因為複眼上的每隻眼睛,管的視角和頻率都很窄。如果要在人的頭部形成如同昆蟲一樣具有全角度檢測能力的複眼,著名物理學家費恩曼曾經做過初略的計算,他的結論是複眼的大小可能會超過現在人類頭部的尺寸,結果頭很可能承受不了眼睛的重量。

當然,除了這些情況看不見外,人過於關注某些人或事情時會對周圍情形視而不見, 人不關注某些人或事情時也會視而不見,或熟視無睹。這些依賴於情感和心靈的視而不見和熟視無睹,比起單從視覺上發生的,就要複雜多了,也是人工智能目前還完全找不到北的問題之一。

參考文獻:

1、克里斯托弗 · 查布利斯/丹尼爾 · 西蒙斯[著],段然[譯]. 看不見的大猩猩. 北京大學出版社,2011年

2、費恩曼, 萊頓, 桑茲著. 鄭永令, 華宏鳴, 吳子儀等譯. 費恩曼物理學講義(第1卷). 上海科學技術出版社, 2013年


分享到:


相關文章: