日本京都大學新研究:AI讀取腦波,重建人類思維

新智元編譯

翻譯:馬文

【新智元導讀】 日本ATR國際電氣通信先端技術研究所和日本京都大學的研究人員稱他們創造了一個能夠讀取人的腦波的AI。他們構建了一個神經網絡, 可以解讀並且準確地再現一個人看到的圖像或想象的圖像。

日本ATR國際電氣通信先端技術研究所和日本京都大學的研究人員稱他們創造了一個能夠讀取人的腦波的AI。他們構建了一個神經網絡,不僅可以讀取,而且能夠重建你的思維。

具體來說,根據ZME Science網站的報道,“研究團隊創建了一種算法,可以解讀並且準確地再現(reproduce)一個人看到的圖像或想象的圖像。”

日本京都大学新研究:AI读取脑波,重建人类思维

深度圖像重建的結構圖。對輸入圖像的像素值進行了優化,使圖像的DNN特徵與fMRI活動中解碼的特徵相似。一個深度生成器網絡(DGN)可以選擇與DNN組合以產生自然的圖像,其中優化是在DGN的輸入空間中執行的。Credit: bioRxiv (2017). DOI: 10.1101/240317

研究論文的標題是“利用人類大腦活動的深度圖像重建”(Deep image reconstruction from human brain activity),論文寫道,研究者能夠根據一個人正在觀察的場景來複制一個圖像。這些AI創造的圖像與人實際看到的並不完全一樣,只是模糊地表現了人的思維。不過,AI還是能夠利用腦電波來重建這些圖像。

儘管距離實際使用可能還需幾十年的時間,但是這項技術使我們距離創造 能夠閱讀和理解人類思維的系統 更近了一步。

深度圖像重建:自然圖像

試圖馴服一臺計算機來解碼心理意象(mental image)並不是新的想法。事實上,這一研究已經持續了許多年,研究人員從2011年起就開始試圖重建大腦的畫面,例如電影片段、照片,甚至夢境。但是,以前所有的系統在範圍和能力上都很有限。有些只能處理人臉形狀之類狹窄的區域,有些只能通過預先設計好的圖像或類別(例如,“鳥”、“蛋糕”、“人”等)來重建圖像。到目前為止,所有這些技術都要求有預存的數據;它們起作用的方式是將受試者的大腦活動與之前記錄的人正在觀察圖像時的大腦活動相匹配。

但研究人員稱,他們的新算法可以從零開始生成新的、可識別的圖像,甚至可以生成僅僅是人的大腦想象出來的形狀。

這一切都始於功能性核磁共振成像(fMRI)技術,這是一種測量大腦血液流動的技術,並用其結果判斷神經活動。研究團隊將3名受試者的視覺處理區域以2毫米分辨率掃描。掃描執行了數次。在每一次掃描中,這3名受試者被要求觀看1000張以上的圖片,圖片包括一條魚、一架飛機和一些簡單的彩色圖形。

日本京都大学新研究:AI读取脑波,重建人类思维

一種新的算法,利用大腦活動來重建(底下兩行)所觀察的圖片(第一行)。 圖片來源:Kamitani Lab

該研究團隊的目標是理解對圖像反應的大腦活動,並最終通過計算機程序生成能夠在大腦中產生類似反應的圖像。

團隊最近開始取得成果。研究人員使用一個深度神經網絡(DNN)和幾層簡單的處理元素,而不是一張接一張地向受試者展示圖像,直到計算機得到正確的結果。

神谷之康(Yukiyasu Kamitani)是這項研究的主要作者,他說:“我們相信深度神經網絡可以很好地表示大腦的層級式處理。”

“使用DNN,我們可以從大腦視覺系統的不同層級(從簡單的光對比度到更有意義的內容,例如面部)中提取信息。”

使用decoder,研究人員創建了大腦對DNN中圖像的反應。然後,他們不再需要 fMRI 成像測量,也不再使用DNN翻譯作為模板。

接下來是一個重複的過程,在這個過程中,系統創建圖像,試圖讓DNN對所需的模板做出相似的反應——無論是動物還是彩色的玻璃窗。 這是一個試驗和錯誤的過程,其中程序以中立的圖像開始,並經過200次的重複緩慢地進行改進。為了瞭解它與想要的圖像的接近程度,系統比較了模板和DNN對生成圖像的響應之間的差異。這樣的計算允許它逐個像素地朝著理想的圖像改進。

為了提高最終圖像的準確性,團隊利用了一個“深度生成器網絡”(deep generator network,DGN),這是一種經過預訓練的算法,可以從原始輸入中創建逼真的圖像。從本質上來說,DGN是將完成後的細節放在圖像上,使其看起來更自然。

在DGN完成對照片的修補後,一箇中立的人類觀察者被要求對這項工作進行評價。他會被展示了兩張圖片供選擇,並被提問哪張圖片是算法重建的。作者在論文中寫道,人類觀察者能夠在99%的時候能夠正確選擇系統生成的圖像。

接下來是將所有的工作與“讀心術”的過程結合起來。他們要求三名受試者回憶之前展示給他們的圖像,並掃描他們的大腦。在個過程有點棘手,但結果仍然令人興奮——這個方法對照片效果不好,但是對於形狀,生成器在83%的時候能夠創建可識別的圖像。

需要注意的是,這一工作看起來非常整潔和謹慎。他們的系統運行得很好,可能瓶頸不在於軟件,而在於我們測量大腦活動的能力。或許我們需要等待更好的fMRI成像技術和其他大腦成像技術的出現。

本文來自新智元,創業家系授權發佈,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]


分享到:


相關文章: