業餘愛好者的傑作:AI系統能夠準確分辨真假倫勃朗畫作

一種新的AI算法,可能有望解決以往一直難以攻克的圖像識別與分析問題——特別是那些由於AI訓練數據集太小,或者個別樣本圖像太大/分辨率過高而導致AI算法無法處理的場景。這種新算法已經能夠檢測出倫勃朗這位著名藝術家的畫作,同時準確發現偽造品。更重要的是,這一算法的創作者亦在積極尋求其它潛在發展方向,希望能夠找到利用小規模數據集實現AI神經網絡功能訓練的可行途徑。

業餘愛好者的傑作:AI系統能夠準確分辨真假倫勃朗畫作


利用業餘時間,來自馬薩諸塞州的一對夫婦編寫出一套系統,據稱其能夠在高達90%的準確率從圖片中識別出倫勃朗的畫作。

根據採訪,這兩位AI研究人員在算法構建當中借用到熱力學與信息論中的一大重要概念——熵,旨在利用AI系統成功找出偽造的藝術品。

在煮沸的水以及黑洞等物理系統當中,熵這一概念指的是特定體積之內所包含的紊亂度量。而在圖像文件當中,熵則被定義為文件中所包含的有用/非冗餘信息量。

馬薩諸塞州弗雷明漢市IEEE成員兼業餘AI程序員(以及全職專利律師)Steven Frank表示,“熵用於衡量信號中信息的多樣性水平。其基本思路在於,如果一條消息的全部內容都是「1」,那麼其中就完全不存在熵,因為內容並沒有任何多樣性可言。但如果消息的內容是一條完全隨機的序列,則代表其中包含極高的熵值與高度多樣性……這同時意味著,我們無法對其進行壓縮或者使用比消息更小的任何bit對其進行描述。”

因此,對單一圖像的熵進行評級,就意味著確定圖像當中包含怎樣的數字多樣性評分——即圖像的單調性或算法(低熵評分)與隨機性及不可預測性(高熵評分)之間的關係。可以肯定的是,這種作法與定性或者美學判斷無關。此類指標在藝術評論家眼中可能一文不值,但卻有可能在計算機平臺上發揮重大作用。Frank辛集國,實際上圖像中的熵值有可能在利用AI技術處理高分辨率圖像這一長期難題層面帶來突破性助力。

這是因為以MB甚至GB為單位的超高分辨率圖像往往體積過大,無法通過AI神經網絡進行處理——特別是圖像識別算法中常見的所謂卷積神經網絡(簡稱CNN)。


業餘愛好者的傑作:AI系統能夠準確分辨真假倫勃朗畫作


研究人員們利用少量倫勃朗的肖像畫(包括他的自畫像,如圖所示)對AI神經網絡進行訓練,並由此得出了能夠測試藝術品是否屬於偽造的識別算法。

1935年,荷蘭畫家倫勃朗-範-賴恩的作品集中僅列出611幅畫作。

然而,即使是這樣的數字也仍然不足以採信。目前藝術家評論家們認為,實際畫作數量可能只佔一半(這是因為世界上存在著大量關於倫勃朗作品的仿製品、複製品與偽造品)。

但即使將全部611幅由倫勃朗乃至其他偽造者創作的畫作全部投入識別卷識神經網絡的訓練,這樣的數據集規模也只佔AI專家所認可的最低圖像識別訓練素材量的12%。

換言之,如果要讓AI能夠從偽造品當中準確找到真正的倫勃朗畫作,那麼其至少需要先觀察5000張倫勃朗的畫作。而在理想情況下,我們最好還能為AI系統提供更多來自偽造者、模仿者乃至複製者的更多圖像樣本作為參考。

由於客觀上不存在這樣的條件,因此AI技術在解決倫勃朗乃至其他著名藝術家畫作的識別任務時一直髮揮不了什麼實質性作用。

Frank希望探索,熵概念能否給這兩個問題找到答案?即圖像分辨率過高問題,以及用於訓練CNN的數據集規模太小的問題。

對於任何一幅給定的畫作,例如倫勃朗於1654所創作的Jan Six肖像,一款簡單的計算機程序(甚至不需要AI技術)就能夠計算出它的熵評分。假設Jan Six肖像的熵評分為……只是假設哦,6分。現在,Frank和他的合作者(妻子)Andrea Frank意識到,他們可以在Jan Six肖像上運行一套簡單的腳本,從而將整體大圖像拆分成大量100 x 100像素的圖塊,且整體熵等級為6。接下來,腳本進一步將所有評分為6的200 x 200像素塊挑選出來,而後是400 x 400像素的熵評分6圖塊。

在此之後,這些100像素、200像素以及400像素的圖塊至少在數學意義上講包含有與其父圖像相同的信息混亂度。因此,Frank希望弄清在這些圖塊之上(而非全尺寸原件)訓練出的神經網絡是否也能夠“教會”神經網絡如何從偽造品中辨別出倫勃朗的原作。

他們的方法是將倫勃朗那些廣為人知的著名肖像畫作拆分成大約1萬3千個圖塊。在此之後,他們利用這些圖塊訓練自己的CNN,而非像傳統方法那樣著眼於原始畫作。為了測試自己的神經網絡,他們引入了一系列已知的偽造品與真品圖像(這些測試素材並未被包含在原始訓練集當中),希望瞭解這套“倫勃朗CNN”能否給出正確判斷。最終,他們報告稱成功率達到90.4%。

分析還得出了另一個令人驚訝的結果,即哪些部分在弄清目標圖像是否屬於倫勃朗畫作真品方面發揮著最為重要的作用。

Frank解釋稱,“事實上,對各個圖塊上的筆觸進行分析並不能有效區分倫勃朗本人與倫勃朗風格畫作之間的差異。而在另一方面,在較高的分辨率之下,例如完整截取整個肖像的頭部部分,CNN開始表現得極為擅長從模仿者或者類似風格的藝術家作品中挑選出真正的倫勃朗創造。”

他同時補充稱,“在我們看來,這代表著與倫勃朗同時代的畫家們可能會在筆觸層面模仿他的風格。但如果大家真的希望瞭解倫勃朗作品中那些與眾不同的特色,那麼必須要著眼於尺寸更大的畫作並立足更為宏觀的構圖層級。”

兩位研究者表示,同樣的AI技術可能也會在某些醫學圖像分類場景下發揮作用。舉例來說,放射學圖像的體積往往非常龐大——可能達到數百MB甚至更高。CNN無法處理如此龐大的文件,因此放射科醫師必須將圖像縮小至低分辨率快照形式(在此過程中必須導致信息丟失),或者以手工方式挑選有代表性的樣本進行比較與比對——這無疑會給放射科醫生帶來極大的工作負擔。

Frank指出,“我們的系統可以實現更高的性能與更準確的分類效果,因為其不再單純著眼於龐大的整體圖像,而是將其降低至眾多低分辨率圖像,這意味著它完全能夠處理與醫學相關的高分辨率素材。”

不過他也補充稱,與倫勃朗的畫作不同,熵方法當中所不被注意到的某些圖像細節,有可能在醫學領域擁有重要的意義。因此,放射科醫師必須意識到這種算法中的侷限性。

作為眾多圖像分析程序中的工具之一,熵方法能夠為已經明確瞭解其優勢與短板的放射科醫師提供極具現實意義的信息。從理論上講,熵方法有朝一日也將為AI技術提供更多難得的訓練圖像。

與此同時,Frank夫婦強調稱他們並沒有對其算法進行專利申請或者商業化的想法。就目前而言,這種算法只是提供了一種非常聰明的概念驗證方案,能夠利用熵評分機制從大量偽造/模仿品中找出真正來自藝術家本人之手的畫作。雖然範圍有限,但這仍然代表著一大頑固問題被初步攻克。


分享到:


相關文章: