03.04 怎樣用深入淺出的語言(故事),給一個11歲的小孩解釋“精煉貝葉斯均衡”?

raoyaoting


假設有一個殘暴老師,特別討厭課堂上有人講話,只要看到課堂上有人和別人講話,就不分青紅皂白地給這兩個人懲罰,比如作業量翻倍。即使一人沒有講話,殘暴老師也同時懲罰兩人,理由是,沒有講話的那個人可能先前講過話,甚至最開始是主動和另一個人講話的,只不過當時沒被老師看見罷了(比如,當時背過身,正在寫板書)。

為了簡化問題,假設有兩個學生,一個叫小紅,一個叫小明,並且這兩個學生除了彼此之外,課堂上從不和其他學生講話。假設小紅和小明都喜歡在上課時講話,並且,如果沒有主動講話的情況下,作業量翻倍,會覺得被冤枉了,因而心裡超級不爽。

那麼,對於小紅或小明來說,可以採取的策略有兩個:

  1. 憋著,不講話,這樣可以避免作業量翻倍。
  2. 主動和對方講話,這樣雖然作業量翻倍了,但至少上課講話爽到了,也避免被冤枉導致超級不爽。

所以,這一情況下,小紅和小明可能:

  1. 都憋著不講話,直到下課鈴聲響起
  2. 上課鈴聲一響,異口同聲地主動和對方講話

這兩個情況,就是所謂納什均衡

在納什均衡中,雙方的信息是對稱的,也就是小紅知道小明喜歡上課講話,被冤枉會覺得超級不爽,並且也知道小明知道自己上課講話,被冤枉會覺得超級不爽。小明的情況同理。這樣才能構成納什均衡。


過了一陣子,換了一個昏聵老師。昏聵老師也特別討厭課堂上有人講話,但是ta有一個信念,就是成績好的學生不喜歡上課講話,成績不好的學生上課喜歡講話。所以,一旦發現有兩人同時在課堂上講話,就會處罰成績不好的學生,而不處罰成績好的學生,理由是肯定是成績不好的學生主動和成績好的學生講話,拉成績好的學生“下水”的。但昏聵老師也沒有昏聵到家,如果ta看到成績好的學生在講話,成績不好的學生不在講話,還是會處罰成績好的學生的。

這一情況下,假設小紅成績好,小明成績不好,那麼,各自選擇的策略會是:

  • 小明:即使我不主動去和小紅講話,一旦小紅主動和我講話,我們一起講話,最後挨罰的是我。所以我還不如主動去和小紅講話,想講就講,何必壓抑自己。
  • 小紅:我還是不要和小明主動講話的好,如果主動發起講話,小明還沒有回話的時候,被老師看到了,老師會處罰我,而且被抓到的次數多了,老師會認為我也喜歡講話,發現我和小明同時講話時,就不會不處罰我了。

所以,昏聵老師的信念,本來只是一個偏見,實際上本來小紅和小明都喜歡講話。但ta基於信念採取的懲罰措施,反而導致小明更愛主動講話,小紅更少主動講話。而這又會進一步強化昏聵老師的信念。昏聵老師的偏見被實現了。

這一過程,稱為貝葉斯均衡


又過了一陣子


你以為我要說“又換了一個老師”嗎?並不是。小紅和小明小學畢業了,分別去了不同的初中。

你以為我要說“故事結束了”嗎?並不是。混同均衡和分離均衡還沒講呢。所以,命運讓小紅和小明考上了同一所高中,並且分到了同一個班級。

小明長大了,特別爭強好勝,又記起小學時昏聵老師對小紅的偏心,非常氣憤,所以很想和小紅比一比成績。但是因為小明非常爭強好勝,又只打算在有把握自己成績比小紅高時,才和小紅比成績。

而小紅呢,也長大了,並不想和小明比成績,覺得小明很幼稚,不想和小明說話。

高中的老師是個佛系老師,並不想讓學生們攀比成績,又認為成績是學生的隱私,從來不公佈成績。所以,小紅和小明彼此不知道對方的成績。

一次考試後,小明考得很好,臉上喜氣洋洋的。小明不知道小紅的成績,於是觀察小紅的表情。小紅這次發揮失常,考得並不好,但是因為不想讓小明過來比成績,所以也裝出喜氣洋洋的樣子。小明看小紅同樣喜氣洋洋的樣子,吃不準小紅的成績比自己高還是低,於是沒有找小紅比成績。

這就是混同均衡,小紅和小明成績不一樣,但卻發送了相同的信號(表情)。


過了一陣子,佛系老師因為對學生成績無所謂,被辭退了。來了一個科學老師。這個科學老師也不公佈學生成績,但講究因材施教,也就是說,成績好的學生作業佈置得多,成績差的學生作業佈置得少,分為A、B、C、D、E、F六檔。而作業量是公開的(看每人領的試卷厚度就知道了)。小紅本來可以考90分,對應作業A檔,但小紅很懶,並不想多做作業,打算考個20分左右,這樣作業F檔,不要太輕鬆。不過,小紅知道小明的水平大概是70分(C檔),為了避免小明找自己比成績,小紅只好考了80分左右(B檔)。這樣,通過作業量的不同,小紅讓小明知道自己成績高,避免小明過來比成績。

這就是分離均衡,小紅明明可以少做作業,但為了證明自己比小明成績高,額外多做了作業。


分享到:


相關文章: