人工神經網絡導論——計算機視覺講述


人工神經網絡導論——計算機視覺講述

這張照片是什麼?

當場景中的內容到達您的眼睛時,您的大腦會立即識別出一堆東西:幾隻鹿,一輛汽車,茂密的灌木叢和草還有背後的大樹幹。草和灌木叢是相似的顏色,但不是一回事。您的大腦甚至可能使您感覺到灌木叢上的花朵聞起來像什麼。

顯然,您的大腦正在執行一系列重要的處理,依靠內置的機制和視覺信息為您提供豐富的場景體驗。電腦沒有這樣的東西,但這是AI研究人員填補空白的偉大項目之一。

本文中,我們將詳細研究計算機視覺

處於長達6億年的動物視覺進化的制勝法寶上,我們大多數人不理解使計算機能夠“看到”的困難之處。甚至看不到計算機能看到什麼。

我們必須習慣的事情之一是計算機只能以數字思考。無論是文字、照片,歌曲還是視頻,它們都由數字列表表示。

當光線進入計算機的攝像頭時,它會擊中像素並在整個場景中測量光強度。保存在內存中,圖片中的場景看起來像這樣:

人工神經網絡導論——計算機視覺講述

…………這個風景有點……………

在我們繼續研究計算機視覺之前,很重要的一點是,讓我們的人工智能同胞們戴上進化的超級護目鏡,從而產生共鳴。

首先,讓我們看看照片的一小塊區域(約佔像素的1%),然後把他放大,這樣我們就可以看到單個的像素。只用你的標準視覺系統(眼睛),盡你最大的努力去辨別下面的照片片段是什麼。

人工神經網絡導論——計算機視覺講述

沒錯,沒有顏色,這有點太難了。畢竟,計算機上的大多數圖像文件都存儲顏色信息。

好的,那我們就出一張帶顏色的。

人工神經網絡導論——計算機視覺講述

這次能看出來了嗎?

人工神經網絡導論——計算機視覺講述

一輛行駛在公路上的汽車。有了完整的圖像,您的視覺系統就會被場景的背景所包圍,從而意識到這些小塊很可能是汽車。在那之後,所有關於遺漏細節都被取消。

在上一個問題中,如果將原來是汽車的像素斑塊放置在星雲或湖面反射表面的圖像中,則您可能已將該斑塊解釋為背景恆星或稀疏的雲。

這表明您的大腦所做的不僅僅是將視覺信息與某些內部視覺詞典匹配。您看到的每幅圖像都與您以前的觀看體驗混合在一起。

我們所看到的事物受上下文影響的事實並未被所謂的“光學幻覺”所掩蓋。這些不一致的經驗提供了一種開始剝離人類視覺系統內處理層的方法。

人工神經網絡導論——計算機視覺講述

哪個圓圈的陰影為深灰色?

視覺系統選擇簡化或改造的東西同樣令人印象深刻。

在下面的動畫中,一圈洋紅色斑點一次閃爍一次,因此看起來像是一個“洞”正在旋轉一圈。盯著黑十字,並跟蹤洋紅色斑點隨時間的出現情況。


分享到:


相關文章: