倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

下文節選自《魔鬼數學》, 已獲中信授權許可, [遇見數學] 特此表示感謝!

同很多的“二戰”故事一樣,這個故事講述的也是納粹將一名猶太人趕出歐洲,最後又為這一行為追悔莫及。1902 年,亞伯拉罕·瓦爾德出生於當時的克勞森堡,隸屬奧匈帝國。瓦爾德十幾歲時,正趕上第一次世界大戰爆發,隨後,他的家鄉更名為克魯日,隸屬羅馬尼亞。瓦爾德的祖父是一位拉比,父親是一位麵包師,信奉猶太教。瓦爾德是一位天生的數學家,憑藉出眾的數學天賦,他被維也納大學錄取。上大學期間,他對集合論與度量空間產生了深厚的興趣即使在理論數學中,集合論與度量空間也算得上是極為抽象、晦澀難懂的兩門課程。

但是,在瓦爾德於 20 世紀 30 年代中葉完成學業時,奧地利的經濟正處於一個非常困難的時期,因此外國人根本沒有機會在維也納的大學中任教。不過,奧斯卡·摩根斯特恩(Oskar Morgenstern)給了瓦爾德一份工作,幫他擺脫了困境。摩根斯特恩後來移民美國,並與人合作創立了博弈論。1933 年時,摩根斯特恩還是奧地利經濟研究院的院長。他聘請瓦爾德做與數學相關的一些零活兒,所付的薪水比較微薄。然而,這份工作卻為瓦爾德帶來了轉機,他進入了考爾斯經濟委員會(該經濟研究院當時位於科羅拉多州的斯普林斯市)。儘管政治氣候越發糟糕,但是瓦爾德並不願意徹底放棄理論數學的研究。納粹攻克奧地利,讓瓦爾德更加堅定了這一決心。在科羅拉多就職幾個月之後,他得到了在哥倫比亞大學擔任統計學教授的機會。於是,他再一次收拾行裝,搬到了紐約。

從此以後,他被捲入了戰爭。


倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

圖自: https://www.slideshare.net/SatelliteCenter/kill-your-presentationnot-your-audience

在第二次世界大戰的大部分時間裡,瓦爾德都在哥倫比亞大學的統計研究小組(SRG)中工作。統計研究小組是一個秘密計劃的產物,它的任務是組織美國的統計學家為“二戰”服務。這個秘密計劃與曼哈頓計劃(Manhattan Project)有點兒相似,不過所研發的武器不是炸藥,而是各種方程式。事實上,統計研究小組的工作地點就在曼哈頓晨邊高地西 118 街 401 號,距離哥倫比亞大學僅個街區。如今,這棟建築是哥倫比亞大學的教工公寓,另外還有一些醫生在大樓中辦公,但是在 1943 年,它是“二戰”時期高速運行的數學中樞神經。在哥倫比亞大學應用數學小組的辦公室裡,很多年輕的女士正低著頭,利用“馬前特”桌面計算器計算最有利於戰鬥機瞄準具鎖定敵機的飛行曲線公式。在另一間辦公室裡,來自普林斯頓大學的幾名研究人員正在研究戰略轟炸規程,與其一牆之隔的就是哥倫比亞大學統計研究小組的辦公室。

但是,在所有小組中,統計研究小組的權限最大,影響力也最大。他們一方面像一個學術部門一樣,從事高強度的開放式智力活動,另一方面他們都清楚自己從事的工作具有極高的風險性。統計研究小組組長艾倫·沃利斯(W. Allen Wallis)回憶說:“我們提出建議後,其他部門通常就會採取某些行動。戰鬥機飛行員會根據傑克·沃爾福威茨(Jack Wolfowitz)的建議為機槍混裝彈藥,然後投入戰鬥。他們有可能勝利返回,也有可能再也回不來。海軍按照亞伯·基爾希克(Abe Girshick)的抽樣檢驗計劃,為飛機攜帶的火箭填裝燃料。這些火箭爆炸後有可能會摧毀我們的飛機,把我們的飛行員殺死,也有可能命中敵機,幹掉敵人。”

數學人才的調用取決於任務的重要程度。用沃利斯的話說,“在組建統計研究小組時,不僅考慮了人數,還考慮了成員的水平,所選調的統計人員都是最傑出的。”在這些成員中,有弗雷德裡克·莫斯特勒(Frederick Mosteller),他後來為哈佛大學組建了統計系;還有倫納德·薩維奇(Leonard Jimmie Savage),他是決策理論的先驅和貝葉斯定理的傑出倡導者。麻省理工學院的數學家、控制論的創始人諾伯特·維納(Norbert Wiener)也經常參加小組活動。在這個小組中,米爾頓·弗裡德曼(Milton Friedman)這位後來的諾貝爾經濟學獎得主只能算第四聰明的人。

小組中天賦最高的當屬亞伯拉罕·瓦爾德。瓦爾德是艾倫·沃利斯在哥倫比亞大學就讀時的老師,在小組中是數學權威。但是在當時,瓦爾德還是一名“敵國僑民”,因此他被禁止閱讀他自己完成的機密報告。統計研究小組流傳著一個笑話:瓦爾德在用便箋簿寫報告時,每寫一頁,秘書就會把那頁紙從他手上拿走。從某些方面看,瓦爾德並不適合待在這個小組裡,他的研究興趣一直偏重於抽象理論,與實際應用相去甚遠。但是,他幹勁兒十足,渴望在座標軸上表現自己的聰明才智。在你有了一個模糊不清的概念,想要把它變成明確無誤的數學語言時,你肯定希望可以得到瓦爾德的幫助。

倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

於是,問題來了。我們不希望自己的飛機被敵人的戰鬥機擊落,因此我們要為飛機披上裝甲。但是,裝甲會增加飛機的重量,這樣,飛機的機動性就會減弱,還會消耗更多的燃油。防禦過度並不可取,但是防禦不足又會帶來問題。在這兩個極端之間,有一個最優方案。軍方把一群數學家聚攏在紐約市的一個公寓中,就是想找出這個最優方案。

軍方為統計研究小組提供了一些可能用得上的數據。美軍飛機在歐洲上空與敵機交火後返回基地時,飛機上會留有彈孔。但是,這些彈孔分佈得並不均勻,機身上的彈孔比引擎上的多。

倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

軍官們認為,如果把裝甲集中裝在飛機最需要防護、受攻擊概率最高的部位,那麼即使減少裝甲總量,對飛機的防護作用也不會減弱。因此,他們認為這樣的做法可以提高防禦效率。但是,這些部位到底需要增加多少裝甲呢?他們找到瓦爾德,希望得到這個問題的答案。但是,瓦爾德給出的回答並不是他們預期的答案。

瓦爾德說,需要加裝裝甲的地方不應該是留有彈孔的部位,而應該是沒有彈孔的地方,也就是飛機的引擎。

瓦爾德的獨到見解可以概括為一個問題:飛機各部位受到損壞的概率應該是均等的,但是引擎罩上的彈孔卻比其餘部位少,那些失蹤的彈孔在哪兒呢?瓦爾德深信,這些彈孔應該都在那些未能返航的飛機上。勝利返航的飛機引擎上的彈孔比較少,其原因是引擎被擊中的飛機未能返航。大量飛機在機身被打得千瘡百孔的情況下仍能返回基地,這個事實充分說明機身可以經受住打擊(因此無須加裝裝甲)。如果去醫院的病房看看,就會發現腿部受創的病人比胸部中彈的病人多,其原因不在於胸部中彈的人少,而是胸部中彈後難以存活。

數學上經常假設某些變量的值為 0,這個方法可以清楚地解釋我們討論的這個問題。在這個問題中,相關的變量就是飛機在引擎被擊中後不會墜落的概率。假設這個概率為零,表明只要引擎被擊中一次,飛機就會墜落。那麼,我們會得到什麼樣的數據呢?我們會發現,在勝利返航的飛機中,機翼、機身與機頭都留有彈孔,但是引擎上卻一個彈孔也找不到。對於這個現象,軍方有可能得出兩種分析結果:要麼德軍的子彈打中了飛機的各個部位,卻沒有打到引擎;要麼引擎就是飛機的死穴。這兩種分析都可以解釋這些數據,而第二種更有道理。因此,需要加裝裝甲的是沒有彈孔的那些部位。

倖存者偏差:數學家亞伯拉罕·瓦爾德與失蹤的彈孔

美軍將瓦爾德的建議迅速付諸實施,我無法準確地說出這條建議到底挽救了多少架美軍戰機,但是數據統計小組在軍方的繼任者們精於數據統計,一定很清楚這方面的情況。美國國防部一直認為,打贏戰爭不能僅靠更勇敢、更自由和受到上帝更多的青睞。如果被擊落的飛機比對方少 5%,消耗的油料低 5%,步兵的給養多 5%,而所付出的成本僅為對方的 95%,往往就會成為勝利方。這個理念不是戰爭題材的電影要表現的主題,而是戰爭的真實寫照,其中的每一個環節都要用到數學知識。

瓦爾德擁有的空戰知識、對空戰的理解都遠不及美軍軍官,但他卻能看到軍官們無法看到的問題,這是為什麼呢?根本原因是瓦爾德在數學研究過程中養成的思維習慣。從事數學研究的人經常會詢問:“你的假設是什麼?這些假設合理嗎?”這樣的問題令人厭煩,但有時卻富有成效。在這個例子中,軍官們在不經意間做出了一個假設:返航飛機是所有飛機的隨機樣本。如果這個假設真的成立,我們僅依據倖存飛機上的彈孔分佈情況就可以得出結論。但是,一旦認識到自己做出了這樣的假設,我們立刻就會知道這個假設根本不成立,因為我們沒有理由認為,無論飛機的哪個部位被擊中,倖存的可能性是一樣的。用數學語言來說,飛機倖存的概率與彈孔的位置具有相關性,相關性這個術語我們將在第 15 章討論。

瓦爾德的另一個長處在於他對抽象問題研究的鐘愛。曾經在哥倫比亞大學師從瓦爾德的沃爾福威茨說,瓦爾德最喜歡鑽研的“都是那些極為抽象的問題”,“對於數學他總是津津樂道,但卻對數學的推廣及特殊應用不感興趣”。

的確,瓦爾德的性格決定了他不大可能關注應用方面的問題。在他的眼中,飛機與槍炮的具體細節都是花裡胡哨的表象,不值得過分關注。他所關心的是,透過這些表象看清搭建這些實體的一個個數學原理與概念。這種方法有時會導致我們對問題的重要特徵視而不見,卻有助於我們透過紛繁複雜的表象,看到所有問題共有的基本框架。因此,即使在你幾乎一無所知的領域,它也會給你帶來極有價值的體驗。

對於數學家而言,導致彈孔問題的是一種叫作“倖存者偏差”(survivorship bias)的現象。這種現象幾乎在所有的環境條件下都存在,一旦我們像瓦爾德那樣熟悉它,在我們的眼中它就無所遁形。

以共同基金為例。在判斷基金的收益率時,我們都會小心謹慎,唯恐有一絲一毫的錯誤。年均增長率發生 1%的變化,甚至就可以決定該基金到底是有價值的金融資產還是疲軟產品。晨星公司大盤混合型基金的投資對象是可以大致決定標準普爾 500 指數走勢的大公司,似乎都是有價值的金融資產。這類基金1995~2004 年增長了 178.4%,年均增長率為 10.8%,這是一個令人滿意的增長速度。如果手頭有錢,投資這類基金的前景似乎不錯,不是嗎?

事實並非如此。博學資本管理公司於 2006 年完成的一項研究,對上述數字進行了更加冷靜、客觀的分析。我們回過頭來,看看晨星公司是如何得到這些數字的。2004 年,他們把所有的基金都歸為大盤混合型,然後分析過去 10 年間這些基金的增長情況。

但是,當時還不存在的基金並沒有被統計進去。共同基金不會一直存在,有的會蓬勃發展,有的則走向消亡。總體來說,消亡的都是不賺錢的基金。因此,根據 10 年後仍然存在的共同基金判斷 10 年間共同基金的價值,這樣的做法就如同通過計算成功返航飛機上的彈孔數來判斷飛行員躲避攻擊操作的有效性,都是不合理的。如果我們在每架飛機上找到的彈孔數都不超過一個,這意味著什麼呢這並不表明美軍飛行員都是躲避敵軍攻擊的高手,而說明飛機中彈兩次就會著火墜落。

博學資本的研究表明,如果在計算收益率時把那些已經消亡的基金包含在內,總收益率就會降到 134.5%,年均收益率就是非常一般的 8.9%。《金融評論》(Review of Finance)於 2011 年針對近5 000只基金進行的一項綜合性研究表明,與將已經消亡的基金包括在內的所有基金相比,仍然存在的2 641只基金的收益率要高出 20%。倖存者效應的影響力可能令投資者大為吃驚,但是亞伯拉罕·瓦爾德對此已經習以為常了。


分享到:


相關文章: