大腦是預測機器

大腦是預測機器
摘要 / Abstract

預測塑造了我們感知、理解這個世界的方式——這一觀點在系統神經科學界變得越來越有影響力,同時也為我們理解神經精神性失調提供了一個框架——一般情況下,先驗信息會影響我們的感知和觀念;而這一機制在精神失調人群中被幹擾了。這導致了患者無法形成表徵這個世界的最優模型。越來越多的人將預測的影響概念化為“自上而下”的過程——從信息加工的角度來看,產生於(皮層)更高級區域的預測影響了位於更底層的區域。然而,這種看法並沒有考慮“自下而上”信息加工過程中產生的預測信息。正如本文將揭示的一樣,區分“自下而上”與“自上而下”的預測過程,是極其重要的。這種區分也是構建出預測加工框架的關鍵,這將幫助我們理解預測加工過程中的失調是如何引發精神性失調的症狀與體驗的。

生命使用感官輸入來發現周圍的結構,從而創造出對環境的表徵。這樣的表徵是

施動者(agent)*調控與外界交互的關鍵。然而,感官輸入含義模糊並且充滿噪音。因此,大家認為對環境的準確表徵,也是需要先驗信息的。先驗信息提供的預測也許能消除感官信號的模糊,並且讓人可以推測導致感官輸入的外部刺激。根據這個預測加工的框架,基於關於外部世界的先驗信息作出預測,是大腦的關鍵功能

*編者注

在控制論、強化學習和人工智能等領域中,施動者是指在面對環境變化時能夠自主行動並進行自我調節的實體。

就如人們在強化學習和人工智能的領域中所做的,在控制論的領域,我們也將系統——即一套互動組件構成的統一整體——細分成許多施動者及其環境。我們應該如何分辨系統、施動者和環境,取決於具體的問題。比如,系統可能是一條魚(施動者)根據旋渦和水流(環境)做出反應。此外,系統也可以是魚骨骼器官的部分(施動者),在整個身體(環境)中活動。又或者,我們可以將水流和其中的所有生物視為系統。控制論學家考慮的是,

施動者在面對環境的變化時,如何與環境交互從而維持內在的穩態。早期的控制論學家意識到,這個假設同樣也可以用來架構大腦的研究——施動者對環境擾動的最佳反應是預先行動(proactive)而非隨機應變(reactive);也就是說,預測是必要的。這個領域的先驅之一,威廉-羅斯-艾什比(W. R. Ashby),和他的同事提出了兩個定理,來說明施動者如何能夠成功抵抗環境擾動:

既然環境多變,施動者也要多變。在控制論的領域中,多變性(variety)是指一個系統(環境或者施動者)能處在的狀態的總數。如果一個施動者為了維持自己內在的穩態,去控制或調節環境對他們的影響,那麼施動者能處的狀態總數一定大於環境影響他們的方式總數。這就是所謂的必要多變性定理(Law of Requisite Variety)。值得注意的是,這個定理是指施動者通過應對環境的影響,在理想範圍內維持內在穩態的能力,而非其直接影響環境的能力。因此,施動者必備狀態的數目一定會等於或大於所在環境可能擾動或者影響其的方式總數,而非環境能夠達到的狀態總數。

大腦是預測機器

威廉·格雷·沃特(William Grey Walter)和他著名的自動化“陸龜”機器人,該系列機器人可以對外界的光線產生反應、碰到障礙物調整方向、循著導航燈光回到充電處充電,還能彼此產生一定的互動,甚至對鏡中的自己產生反應。

cmu.edu

一個好的調節者能為其所在的環境建立優秀的模型。與必要多變性定理密切相關的是優秀調節者定理。這是一個數學概念:如果施動者成功地減輕了環境狀態的影響,從一些意義上來說,施動者一定建立了一個環境的模型。這就是說,施動者一定知道要用什麼樣的內在狀態來應對什麼樣的環境狀態

早期的控制論學家主要關心的是簡單施動者的性能。其中有一個著名的例子就是一系列的自動化“陸龜”機器人。這些機器人能夠簡單地對環境中的變化作出即時反應,以此參與到與環境的複雜交互中。控制論學家很快意識到,同樣的定律也適用於大腦中的信息處理:

為了成功對環境變化作出正確反應,施動者需要對環境的相關方面進行建模和預測。這意味著,想要了解大腦的設計,我們可以仔細觀察大腦面對的這個外界環境。

大腦是預測機器

- Stephan Schmitz -

這一觀點在心理物理學、靈長類電生理學、認知計算神經科學和臨床神經科學領域變得越來越有影響力。在這些領域中,這個觀點為感知、觀念和行為的紊亂提供了全新的視角。然而,這些領域對“預測”本身的定義常常不明確,因此對這個術語的使用的也很不精準。幾乎在每個地方,預測都被認為是在信息加工的等級中,高等級加工以“自上而下”的方式作用於低等級加工。本文中,我們將提供證據挑戰這個僅僅考慮了“自上而下”的觀點,並且

表明神經系統中還包含了很多其他形式的預測信息,以“自下而上”的加工方式呈現出來

在這篇觀點文章中,我們認為,區分世界上兩種規律(regularity)或者“模式”(pattern)是非常重要的,這兩種規律共同構成了神經系統預測的基礎。我們將介紹時空全局(或者恆常)不區分等級的規律(spatio-temporally global or constant, non-hierarchical regularities)與時空局部的規律(spatio-temporarlly local regularities)之間根本的區別,後者依賴於情景,因此是分等級的。我們將提供證據表明,基於這種兩種規律的先驗信息的預測在機制上是不同的:它們與兩種不同形式的信息加工(自下而上和自上而下)相關。最後,我們舉例說明區分這兩種形式的預測的重要性。雖然我們認為,隨著相關領域研究的成熟,這兩種形式的預測會被進一步細化,我們將這主要的區分——基於形式而非預測的內容的區分——視作是在健康和疾病領域,向更為綜合和多樣的預測加工機制,邁進的重要第一步。

預測的本質

預測是信息理論(information theory)和貝葉斯決策理論(Bayesian decision theory)中的重要部分。貝葉斯模型在幫助我們理解大腦功能上一度發揮了重要的作用,感知和認知推斷(perceptual and cognitive inference)不僅僅依賴於當前的輸入,而且也被所謂的先驗經驗或者關於環境結構的背景信息塑造著。值得強調的是,貝葉斯決策理論提供了一個規範的框架:它允許研究者具體說明施動者考慮到能獲得的信息時,應該如何利用當下的輸入和先驗信息來最大化特定的效用(utility),但是關於這一過程如何實施的準確機制仍然是不可知的。如同一個地圖能詳述最佳路線卻不能提供最好的交通方式一樣,貝葉斯決策框架是關於總體上的客觀預測,而非預測是如何在神經系統中形成的

預測編碼(predictive coding)的概念很大程度上塑造我們瞭如何考慮神經信息的加工,並且在正常和疾病群體中,這個概念啟發了一些最為詳細的神經科學的預測機制。人們提出了一系列的預測編碼模型。這些模型在計算上都是相似的,但是在神經元層面操作的假設卻非常不同。然而,

這些最有預測性的編碼模型使得預測被進一步概念化為自上而下的加工過程

大腦是預測機器

在預示瞭如今預測加工框架大部分思考的控制論(cybernetics)領域中,早期研究對預測的本質提供了一個更廣闊的理解。值得注意的是,我們這裡使用的“預測加工”是作為一個籠統的術語,包含了預測編碼;後者是預測加工的一種特定形式。控制論這個術語來自於“舵手”(steerman)這個希臘詞,這個詞表示了一個成功的施動者一定會通過某種方式控制其周圍環境的效應

:這種控制不一定是通過限制環境,也可以是通過適應性地對環境相關參數的變化作出反應。舵手不一定要控制風,浪潮和洋流,但是舵手可以通過做出調整從而最小化環境對船隻航線的影響。

艾什比提出了必備多變性定理(Law of Requisite Variety)和優秀調節者定理(Good Regulator Theorem),這兩個互補的定理與我們的構想密切相關。這些定理提供了一個關於預測本質的視角。這兩個定理意味著,考慮相關環境影響的結構,能夠為我們關於施動者的根本的特徵設計提供重要的原則性見解。隨著這個想法的深入,環境能對施動者產生影響,施動者也能對環境進行建模。我們認為將環境的規則考慮在內,能夠幫助我們理清必要預測的形式。

我們可以根據不同種類的環境規則對施動者產生影響的時空尺寸進行分類。一般認為,一些規則是時空全局(即不侷限於特定的空間或者時間節點)

並且與施動者與環境的每次相遇有關。這些規則獨立於情境因素,因此是非等級的規則的存在是不可改變的,且與當下情境或者環境中的其他狀態無關。因此我們可以假設,對這些規則進行建模要求施動者經歷並處理相似的情境。支持這個假設的證據正在不斷增加,這些證據會在下文提到。從這些證據出發,我們推斷,讓人得以進行時空全局規則預測的先驗知識,是自下而上的加工結構的基礎。這些先驗信息對我們產生的影響是預測性的;從某種意義上說,這種影響是對施動者周圍環境(與當下具體情境無關)的總體預測,並不依賴於當下的感官輸入。我們假設,這種預測在每次施動者遇到刺激時無可避變地自動發生,決定和塑造了我們一直以來與世界的交互。

大腦是預測機器

- Stephan Schmitz -

全局預測限制的概念雖然並非全新的,但是被現有的預測加工解釋所忽略。現有的解釋更多地的關注是另一種時空局部規則相關的預測。這些規則只會在特定的環境下出現從而影響施動者。由於他們的情境依存性,這些規則具有等級結構,在等級結構中,情境狀態決定了規則出現或者相關與否。為了對這些規則進行建模,施動者的大腦必須反映出規則的特徵。這可以通過一個有等級的、自上而下的加工系統來實現:高等級的信息加工機制提取當下的情境信息,然後將預測結果返回給低等級的單元,以此來調製先前的加工。

兩種規則到預測的對應都有等價的控制論中的舵手比喻:船的材料和形狀是不變的——因為舵手依賴航行的媒介的核心特質是不變的。對比之下,對船結構特徵的利用一定進行了情境相關地變化,來應對環境特徵變化(風,浪潮,和洋流)所帶來的挑戰。簡單來說,

施動者具有不變的特徵,用來調控周圍環境的恆定的影響,同時也有情境依賴的特徵,這些特徵反映和調控周圍世界的情境依賴特徵。在下一節中,我們將給出支持這個觀點證據的梗概。

現在開始,我們將使用術語“限制”(constraint)來指情境獨立的規則和由此形成的情境獨立的預測的基礎。這個術語來自於計算機視覺領域。在這個領域中,限制指代一個相似的觀點。它直觀地指出,神經系統的結構強迫信息加工沿著預先決定好的道路前進。這些道路的軌跡是施動者根據先驗信息對環境的估計,因此是預測性的。值得注意的是,我們不支持對“預測”這個術語的概念進行擴張。相反,我們認為,對於這個術語的計算概念的一致性使用,能引導我們思考自下而上加工的限制如何就是預測性的。與限制相反的是,我們使用術語,“期望”(expectation)來指代與情境依賴的規則的相關先驗信息。注意的自上而下加工的影響在功能上與預測加工不同,預測加工是本文的所關注的,因此我們不會討論注意的自上而下加工的細節。

規律與預測

| 情境獨立規律性與約束

自然世界或許看起來千變萬化,然而,從高地草甸到地中海海岸,自然景觀在圖像中表現出了千絲萬縷的聯繫:不同圖像在諸如局部線條方向、輪廓的形狀與物體的擺放位置的分佈上都非常相似。感官系統在解讀圖像時利用這些規律來優化編碼信息,從而在耗能最小化的同時實現最優表現。如今,越來越多的研究著眼於從神經學角度,探究感官信息(sensory evidence)與基於先驗知識的預測(knowledge-based predictions)是如何整合的。這些研究結果表明,人們基於先驗信息總結出的全局性、情境獨立性規律被內隱地鑲嵌進了信息加工機制的結構中。舉個例子,在景觀圖片中的方向信息並不是均勻分佈的——垂直與水平方向方向在圖片中往往存在著過度表達(over-represented)。正如感官系統對主軸(cardinal axes)方向存在著感官偏差,以及神經元對於該方向的敏感程度更高一樣,

人們在感知局部朝向(local orientation)也存在著基於分佈規則的傾向性。重要的是,基於一些電生理學及功能磁共振成像研究結果,人們認為這種傾向/限制(constraint)是內隱地存在於初級視覺皮層(V1)結構中的調頻於(tuned to)主要(cardinal)方向的神經元在V1區域存在著過度表達,且調頻功能相較於其他神經元更狹窄。在該結構基礎上,人們能夠內隱地進行基於方向知識(先驗信息)的貝葉斯推斷(Bayesian inference),而無需將先驗信息以自上而下層級結構(top-down hierarchy)的方式進行外顯的表達。一項關於另外一個環境基本屬性規律——物體移動速度的研究顯示,(先驗)限制同樣在神經元密度不均勻分佈、相關神經元群調頻功能較為狹窄的結構上得到了內隱表徵。

人們還通過整體的、情境獨立規律對於環境中局部表徵進行分組。定義物體視覺邊界的輪廓中同樣存在著規律性。在提取圖片中的輪廓信息時,人們的視覺系統會利用先驗信息中的典型輪廓形狀來對單個的位置信息進行分組使之成為更大的處理單元。這種分組機制稱作“

聯想場(associate field)”,聯想場中的方向信息分組與自然界中的輪廓分佈規律極為相關。輪廓信息對於定義圖片中的特徵與物體信息至關重要。動物研究顯示,對早期視網膜皮層(early retinotopic cortices)神經元間平行連接(horizontal connection)的結構[MOU3]在聯想場的建立中扮演了不可或缺的重要角色。近來,一項動物研究探究了方向調頻(orientation tuned)的V1神經元中的 “寂靜(silent)”背景。寂靜背景指的是當刺激位於特定視覺區域時,該刺激本身雖不足以激活激活神經元,但能夠調節該神經元的活動。該研究表明V1神經元的水平連接結構在其空間排布上與人類的心理物理聯結場(psychophysical association field)極其相似。V1區域平行聯接排列結構的發現為人們利用與環境結構相關的先驗信息對輪廓識別進行預測提供了神經生理學證據。這些結構嵌入式的限制保證了輪廓中的局部方向信息與我們對世界結構的先驗知識相一致。關於輪廓整合的情境獨立機制可能會受到自上而下層級結構的影響。

甚至在完整的物體中也存在著情境獨立的基本規律。一個例子是,物體的輪廓通常隨著物體一同彎曲(convex)。儘管包含自上而下過程在內的一系列機制都參與了視覺系統將物體從背景中分離的任務,仍有研究表明,情境獨立預測以將彎曲度(convexity)限制鑲嵌於自下而上處理程序內的方式在該任務中發揮重要作用。在V1區域中,前饋神經聯結與反饋神經聯結終止於不同的層級(layer)中,這為我們對自上而下調節與包含了平行影響(horizontal influences)在內的自下而上調節的分離提供了機會。一項對恆河猴使用層級錄製(laminar recordings)的研究表明,V1中的平行聯結在早期圖像-背景分離中發揮了重要作用。重要的是,計算模型顯示,V1區域內神經環路間的促進與抑制平行連接的專一性保證了預測的實施,且這種預測中的彎曲度限制來自於物體結構的情境獨立性規律。

大腦是預測機器

- Stephan Schmitz -

另一個證明背景獨立性規律的例子源於這樣一個事實:部分物體類別常出現在符合經驗規律的位置上。由於我們的生理感官是用於識別環境的,真實世界中物體的座標規律性因此被轉換成為視網膜成像上的規律。舉個例子,草坪與地毯的座標位置可以轉換為我們的下半部分視野,而面孔與文字可轉換為我們上半部分的視野。近來一項關於神經元群感受野(populational receptive fields)的研究顯示,對位置規律的預測產生於與特定物體類別相關感受野的高級視覺皮層神經元中,也就是說,感受野對特定物體類別在視野中常出現的位置出現了偏向性。譬如,在英文母語者中,與文字識別相關的神經元群在感受野中的表現為範圍更小、偏向視覺正中,且更偏向於水平排布(而非垂直排布)。該發現在人臉與景色識別中同樣得到了驗證。

總而言之,上述研究表明了外界環境的規律性信息被內隱地編碼於信息處理系統中,且為該系統中穩定的結構性成分。預測由此影響/限制了自下而上的信息處理過程。本段落中我們主要著眼於知覺過程,但還有更多來自學習或其他認知領域的研究

同樣為情境獨立限制提供了證據。譬如,一些實驗證明了不同生物體(organism)對於環境規則的習得程度是不同的。不同生物體對於學習的準備狀態似乎受到了不同程度的限制,限制強度可能是由環境規則與該動物的相關程度決定的。近來一項關於果蠅的準備學習(prepared learning)研究為該發現提供了證據。該研究團隊對兩組果蠅施加不同的實驗處理:一組在施與視覺信號後施加厭惡性刺激,另一組在施與嗅覺信號後施加厭惡性刺激。在經過40代繁殖後,兩組果蠅對不同的刺激(視/嗅)產生了不同的準備狀態。將預測建立在對自下而上信息處理過程的限制中,能夠使得某種特定動物最大程度地利用環境信息,在保證發揮狀態的同時降低代謝耗能。因此,我們不難理解為何人們在開發人工智能算法時會將情境獨立規則鑲嵌進人工智能網絡中。

而這種鑲嵌於結構中的限制源於何處呢?無論是從理論抑或是方法論上,我們都很難將系統發育(phylogeny)與個體發育(ontogeny)對動物的影響分割開來。本文將不對該問題進行進一步的討論,但現存的證據表明,不存在一個能夠解釋所有相關現象的理論系統發育與個體發育可能交互影響了神經系統中該限制的產生

。在一些極端例子中,人們發現該限制可能以獨立於感知經驗的方式而與基因編碼相關。在另外一些例子中,該限制還可能與成年後的相關經歷有關。

| 情境相關規律與期望

另外一些環境規則以情境相關(context-dependent)的形式出現。設想這樣一個場景:在森林漫步時,我們更可能觀察到林地鳥類而非涉禽類。對鳥類種類的識別因而激活了人腦中用於預測特定特徵的表徵——比如對某種形態的喙的表徵。喙的出現預示了某些基礎水平(lower-level)的規律,例如某些特定輪廓及某些朝向邊緣出現的視野位置。在這個例子中,對情境的依賴性取決於輸入刺激的低水平局部特徵規律是由其更高水平特徵決定,還是由與該刺激無關的信息決定。因此,除了情境獨立性特徵外,環境結構中還存在著一種等級嵌套特徵環境中的高等級規律性決定了低等級規律性。我們預測,大腦中必然存在著類似的,用於處理情境相關環境規律的等級嵌套式信息處理機制

。我們認為該處理機制中存在著一種自上而下的結構高級程序由此能夠提取情境信息(contextual information),進行推理預測並將該預測回饋至模型中進而影響早期知覺過程

在大腦皮層結構中存在許多能夠支撐自上而下處理的證據。在上文所舉的鳥類學例子中,環境情境信息決定了我們更有可能碰見哪種鳥類。研究表明,大腦能夠藉助情景-物體相關性(scene-object dependency)對物體進行感知。例如,人們對置於常規情境中的物體識別速度更快。人們認為高水平情境加工皮層(high-level context-specific cortices)由情景作出的預測反饋至低級物體表徵中,從而產生了這種促進作用[73]。當物體粗略的邊緣從背景中提取分離出來時,人腦便推導出規律性預測,由此產生了局部特徵處理與預測間的動態交互影響。許多關於靈長類動物的電生理學研究顯示,自上而下結構能夠極大程度地對信息加工各層級進行過濾,這種過濾甚至影響到了位於皮質下結構的早期信息加工階段

在上文例子中,預測信息主要來自於感官輸入。然而近來,越來越多的研究指出自上而下結構不僅僅利用了感官輸入信息。例如,鳥類學專家能夠迅速地發掘並辨認鳥的種類。心理物理及腦功能成像研究給出了這樣的證據,即對某種物體的專業知識(knowledge)能以自上而下的形式對物體識別發揮顯著的促進作用。此外,心理物理學研究顯示,對特定物體成分甚至語義意義的預期也能以自上而下的形式影響早期視覺特徵的識別。預期產生於感官輸入之前,存儲於高級記憶系統中。腦功能成像研究也給出了類似的證據——儲存於頂葉/額葉區等分佈式網絡中的物體先驗知識,動態影響了早期視網膜皮層中的視覺成像。有趣的是,心理物理學及腦功能成像研究均發現了只有對刺激成分的期望能夠激活早期視覺皮層中的特徵模版

大腦是預測機器

- Stephan Schmitz -

人類及社會性動物的社會互動(social interaction)有較強的情境相關性。一些研究顯示基於先驗社交知識產生的預期對信息加工產生了極其重要的影響。心理物理學研究顯示,人們能夠利用社會互動知識中的情境相關規律來理解他人動作模式中的信息。這種指導關係同樣是自上而下的。甚至是對他人心理狀態的預期,如他人產生某一動作的意圖,都可能影響對社會性信息的早期知覺加工

持續性暴露於相同或類似感官刺激下可能影響人們的感知覺加工,這種現象通常被稱作適應(adaption)。適應現象紛繁複雜,人們對其背後機制的理解尚不完全。現存模型大多反對將其視作被動的“神經疲勞”(neural fatigue)而更傾向於將其理解為一種主動加工,但我們仍不清楚適應現象是否受到了預測加工的影響。人們認為,諸如對重複出現或可預見刺激降低神經反應強度、對不可預知刺激增加反映強度等現象與自上而下處理的情境獨立預測相關。但另一部分研究顯示

自下而上加工也同樣影響著適應現象。認為適應現象與自下而上加工相關的研究通常採用相似的實驗處理,而認為適應現象與自上而下加工相關的實驗採用了各種不同的實驗處理。這些發現可能揭示了兩種機制:一種是受情境獨立限制影響的自下而上加工,另一種是受情境相關預測影響的自上而下加工。後者能夠在多變的環境下發揮作用。

總而言之,許多研究指出,環境預測性可能是情境相關的。在這種情景中,我們在上一部分所討論的鑲嵌了預測信息的自下而上加工便顯得不那麼有幫助。產生最佳表現的個體通常能夠利用預測來以自上而下形式靈活調整信息加工,而現今大多數預測加工模型研究也通常著眼於這種預測形式。

意義與應用

有的人認為,沒有必要區分預測的不同形式,因為它們最終都服務於同一個目的:即促進對世界狀態的推斷,從而優化有機體與世界的相互作用。這種想法是有道理的,當我們努力去對行為進行高層次的、功能性的描述時,就像許多與最優化有關的模型一樣。這些模型為從功能角度評估一個施動者的性能提供了寶貴的基準。

然而,預測處理框架經常做出一個額外的前提假設:即預測過程是由自上而下的機制介導的。正如我們上文所說的,這個觀點是不完整的預測信息可以在大腦中以至少兩種形式實現。如果我們的目標是尋求在神經機制上的理解,那麼修正當前的單一觀點是有必要的。在許多方面,我們都已經看到了增強和擴展單一的預測處理機制的價值。

| 將計算模型與神經機制聯繫起來

如果一個計算模型只描摹出自上而下的預測模型,那麼很可能面臨著計算模型與神經機制之前脫節的風險,這將反過來阻礙模型和實證研究之間的反饋循環,以至於阻礙接下來的研究進展。檢驗包含錯覺的預測過程闡明瞭這個問題。“錯覺”是被故意製造出來的,它違背感官系統在正常狀態中的運行。在目前的預測加工過程中,錯覺被概念化為自上而下加工的結果

。例如,經典的康士維效應(Cornsweet effect)——兩個燈光斑被一箇中心的漸變部分分隔開,造成在亮度上不同的錯覺——已經被視為是自上而下影響的例子,這與關於亮度和反射的空間梯度的信念有關,並且已經使用了一個自上而下預測的網絡進行了模擬。然而,儘管它可能受到神經高層次水平的調節,大部分的影響是源於早期皮層下甚至視網膜的預測信息:康士維效應在理論上與視網膜神經節細胞的感受野結構有關,以及與外側膝狀體核(lateral geniculate nucleus)中信號有很強的相關性(視網膜神經節細胞的投射),並已被證明起源於單眼神經元,表明它起源於皮層之下。更簡潔地說,用自上而下的框架來解釋錯覺的一個主要挑戰是:導致錯覺產生的神經迴路可以獨立於任何先前經驗。這一點已經由臨床證據表明:先天或者早發性失明的人在視力恢復手術後立即會產生某些錯覺,比如繆勒萊耶錯覺(Müller-Lyer illusion)。

大腦是預測機器

康士維效應(Cornsweet effect)

blog.prototypr.io

這些錯覺也許產生於預測處理的過程之中。然而,我們認為這些現象中的大部分(但不一定是全部)都可以被自下而上過程中,與情景無關的約束來更好地解釋。比如,大量的錯覺與來自上面的光有關。關於這個,我們將在下一節詳細討論。在這個例子中,經驗證據和計算模型之間的脫節表明,一個解釋可能在計算層面上具有描述有效性,但是在神經機制層面上是不具備有效性的。有趣的是,已有研究表明,即使是饒(Rao)和巴拉德(Ballard)開創性的預測編碼框架,也是可以通過這樣一種方式加以重新描述:預測也許是通過橫向抑制(lateral inhibition),而非反饋連接(feedback connections)來實現的

顯然,我們需要更緊密地集成神經機制與計算模型,並且在不同尺度上區分不同形式預測的不同

。例如,最近的一項研究暫時支持這樣一種觀點,即情景相關的預測可能共享一個公共源(common source),而情景無關的預測可能依賴於共享另一個源的內置約束。

| 說明預測之間的相互作用

在分級預測處理過程中,預測是在信息處理層次的幾個不同層次生成的。不同層次的預測被認為是通過自上而下的機制相互作用,以確保最終所有的預測都是相互一致的。然而,自下而上的約束和自上而下的期望可能以一種完全不同的方式相互作用。由於約束在很大程度上不會因為預期的短期變化而變化,約束和預期可能會影響相同的過程,但不會相互直接影響而相互對齊。

“自上而下的光的先驗”提供了一個很好的例子。光線照射到視覺場景的方向和由此產生的陰影,提供了人類視覺系統用來推斷物體形狀的信息。在缺乏光源位置的明確信息的情況下,人類觀察者判斷物體的性狀表明,視覺系統會保守地預測光線來自上方。有趣的是,這種預測可以通過經驗來修正;經過訓練後,觀察者收到的反饋表明光源的位置已經改變,視覺系統的預測就會移動到新的位置。對這一現象的傳統預測處理方法表明,自上向下的預測信息已被更新。然而,這與新先驗與實驗室環境的研究結果不一致——先驗是由其他習得線索引起的。另一種解釋與這種情景特異性和電生理學證據相一致,即來自上述光的先驗是作為自下而上處理的一種約束實現的,並且不受短期經驗的影響。實驗訓練並沒有改變原來的約束條件,而是產生了一種新穎的、與環境相關的預期,即光線已經發生了變化。

大腦是預測機器

- Stephan Schmitz -

我們關於不同形式的預測之間相互作用進行了一個有趣的假設:當來自約束和期望的信息相互作用時,前者可能永遠不會被後者完全覆蓋。這與純粹自上而下的預測處理形成了對比,後者的最終目標是確保所有預測都是相互一致的。此外我們的解釋表明,自上而下處理的實驗操作應該對新獲得的預測產生不同的影響,但可能會保持原來的先驗不變。這種差異效應應該進一步在神經水平上觀察到。例如,我們可以預測,神經成像實驗將顯示在高級處理區域對光源位置偏移的短期學習的效果,而自下而上過程的神經特徵將保持不變。

兩種不同形式的預測之間的這種交互形式有助於在耐用性和靈活性之間取得最佳平衡,有趣的是,這種相互作用似乎並不是所有生物體都普遍存在的:即使經過長時間的經驗積累,雞感知物體形狀的方式也表明它們的視覺系統假定光線來自上方。從出生開始,雞似乎就有一種不可改變的自下而上的約束來預測來自上方的光線,並且無法獲得一種與環境相關的期望來調節這些內置的預測,這有力地證明了預測信息可以完全與個人對世界的體驗解耦。

| 確定機制,以告知臨床相關的問題

在精神疾病的臨床實踐中,異質症狀群體經常被誤診為同一個類別的症狀,這是因為不同的診斷可能被重疊的神經生理學干擾。因此,研究往往避開標準的診斷類別,專注於單一症狀,尋求更狹窄但是更深入的機制。預測處理框架一直是這項事業中的重要部分,但是它對單一預測形式的關注經常限制了該框架對症狀多樣性的解釋

以自體抗體介導的神經疾病和精神分裂症為例。越來越多的注意力被吸引到有精神疾病經歷的人身上,他們的血清或腦脊液中發現了含有針對NMDA受體的IgA抗體。這些抗體可能是,但不一定是精神疾病的潛在病因。由於抗體介導的精神疾病的免疫療法只在臨床需要時才進行,因此臨床醫生面臨著一個需要神經機制層面的深入解釋,而不是計算層面的解釋。換句話講,從臨床的角度考慮,預測處理模型更需要一個神經機制層面的解釋

| 將施動者的神經工具箱與環境統計數

| 據聯繫起來

我們已經提出,支持預測的環境中的特徵被有效地歸類為情景無關或情景相關的規律性,並且這些特徵分別映射到約束和期望上。承認這些根本上不同的預測形式,可能會激發對預測的更廣泛的處理框架。特別是,將施動者的信息處理與環境統計聯繫起來的目標,一直是自然場景統計工作中的一個指導原則,併為預測處理的研究提供了一個類似的原則性框架

。例如,對環境規律的分析可能使我們能夠預測並解釋這在多大程度上是由自上而下的過程或由自下而上的處理過程的約束調節,或者為什麼預測過程對情景相關的短期變化的敏感性存在差異。更一般地說,對有機體環境中相關規律的分析可能有助於開發一個統一的框架,從而能夠解釋為什麼有機體在不同領域的預測可能以不同的形式出現。這一觀點提供了一種將預測處理框架與感官生態學和進化理論聯繫起來的方法。

結論

我們的論點背後的原理很簡單:通過觀察環境的結構,可以瞭解施動者的信息處理機制的關鍵設計特徵。這一基本觀點並不新鮮,它不僅推動了早期認知生物學家的思考,還促進了控制論專家,以及目前在自然場景統計方面的工作。在此,我們認為,將這一原理應用於預測在大腦功能中的作用,將為我們提供一個全新而有用的視角。為達到對大腦作為“預測機器”的更深層次的理解,我們認為有必要認識到神經系統的預測有不同的形式

。環境中不可變的規則性反映在相應的獨立於情景的預測機制中,這些機制作用於自下而上的處理,我們將這些機制稱為約束。同樣地,外部世界上下波動的、依賴於情景的規則性指向由自上向下過程實現的靈活的、依賴於情景的預測機制,我們稱之為期望。隨著預測處理的發展,期望能夠被應用到越來越具體的、基於神經機制的問題上。其他的區別可能會有用,但我們認為這裡提出的概念是主要的和基本的。雖然我們主要從神經信息處理的角度來探討這些思想,但對預測在信息處理中的作用有一個全面的認識必須最終包括對整個有機體與其環境相互作用的認識預測信息不僅存在於神經機制中,而且存在於整個生物體的形態中,這一點在許多感官生態學和行為生態學的例子中得到了證明。最後,預測處理框架的目標應該是將預測作為生物信息處理的一部分的許多不同方式結合起來,以便對我們如何與我們的健康和疾病世界相互作用提供更全面的見解。

編譯來源:Teufel, C., Fletcher, P.C. Forms of prediction in the nervous system. Nat Rev Neurosci 21, 231–242 (2020). https://doi.org/10.1038/s41583-020-0275-5

編譯:張紫雯、李蔚、山雞

編輯:阿莫東森

封面:Nino Bosikashvili

排版:小葵花、語月

大腦是預測機器大腦是預測機器
大腦是預測機器大腦是預測機器
大腦是預測機器大腦是預測機器
大腦是預測機器


分享到:


相關文章: