與陶哲軒“共舞”的一個週末

雖然近來陶哲軒和三位物理學家發現了一個新公式的事情終究是一場烏龍,但這場小波瀾仍舊激發了數學家的探索。與對這一公式慣有的解讀和詮釋不同,文本記載的數學家發現的經歷是我們很少能讀到的。作者其間所經歷的掙扎、喜悅,可能很多人也都體會過(比如思考一個困難的數學題成功之後的喜悅),但旁觀者細細讀來,仍不失興味和啟發。


撰文 ∣ 丁玖(美國南密西西比大學數學系教授)


今年11月15日,應我的師兄李弘九 (Noah Rhee) 教授的邀請,我從美國東南部的海濱小城飛到中西部的第七大城,在他任教的密蘇里大學堪薩斯城校區數學與統計系做了一個有關遍歷理論的數學演講。我乘坐早晨六點的飛機,經停亞特蘭大機場,再飛到那裡。沒有想到的是,在堪薩斯城度過的週末值得寫這篇感想之作。


早晨5點,我已在起點機場候機,便習慣性地打開了微信,朋友圈裡有人轉發的一篇名為《3個搞物理的顛覆了數學常識,數學天才陶哲軒:我開始壓根不相信》的文章跳進了我的眼框。文章講的是今年夏季發生的一件事。

8月的一天,一直在加州大學洛杉磯校區教書的這名天才數學家收到三位陌生物理學家的一封電郵,稱:


“我們偶然發現了一個公式,如果這個公式是正確的,那麼它就會在線性代數中一些最基本且重要的對象之間建立一種意想不到的關係。”


陶哲軒教授很納悶:這麼短、這麼簡單的東西,早就應該出現在教科書裡了。這不可能是真的。但是他卻相信了這個公式是新的,於是便把它證明了,這對不知證明了多少艱深數學定理,被認為是當今全世界最聰明的他,是手到擒拿的小事一樁。十天後,他們四人就合寫了一篇不到三頁的論文,題目是Eigenvectors from Eigenvalues(來自特徵值的特徵向量),其中的主要結果就是這三位物理學家發現的那個公式,還用了兩種方法證明之。


與陶哲軒“共舞”的一個週末 | 數學家發現紀實


這個公式將埃爾米特矩陣的長度為1的特徵向量的每一個分量的模平方,即它與其共軛複數之積,用矩陣所有的特徵值以及與這個分量的位置指標相對應的主子矩陣的所有特徵值的某個簡單代數關係表達出來,結果的確漂亮,屬於“美的數學”。然而一般的線性代數教科書中卻沒有它的蹤影,所以四名作者都以為前人把發現這個美麗公式的榮譽留給了他們。


陶哲軒是數學界的超級巨星,他關於數學的一舉一動都會引起媒體的騷動,就像他的數學博客那麼引人一樣。所以眾人也以為他們發現了一個新的公式,有人甚至宣稱“這一公式的理論價值在克萊姆法則之上。”克萊姆法則將非奇異線性代數方程組的解的各分量用一個商來表示,商的分母總是方程組的係數行列式,而分子則是用方程組的右端向量取代解分量位置指標所確定的係數矩陣那個列所得到的新矩陣的行列式。


讀完這篇報道,我隨手將它轉發到我的南大同學群。當我飛到亞特蘭大機場後,又在朋友圈裡讀到了引起轟動的這篇數學文章。但讓我一眼看到的是,文章的第一句竟然有個小小的英文筆誤。


當天下午,我的一位大學同學就在群裡轉發了新消息:這個結果不是新的,北大數學教授徐樹方在他90年代出版的一本關於矩陣計算的書中,關於實對稱三對角矩陣,就給出了同樣的結果。很快,其他關於同一公式的史實記錄紛至沓來,一直追溯到1968年美國加州大學的一位線性代數教授湯姆生 (R. C. Thompson) 及其弟子,以及其他人發表的與之相同或等價的等式。到了第二天,陶哲軒等作者的說明也飄然而至,提供了有關這個結果的部分歷史事實。在被發現的文章中,證明公式成立的基本假設似乎都沒有超出埃爾米特矩陣的範疇。埃爾米特矩陣是其共軛轉置等於它自己的一類矩陣。


一個小小的數學浪花,由於衝浪者的鼎鼎大名,通過快速的網絡傳播,匯成了一股股滔滔巨浪。這就是現代通訊技術的力量。


下午做完了學術報告,與對我演講論題頗感興趣的系主任交流片刻後,我待在師兄的辦公室等待另有活動的他,於是在手機上開始閱讀陶哲軒他們的文章,很快就讀懂了漂亮而精煉的證明。突然一個念頭冒出我的腦海:

這個讓媒體活躍的公式對比埃爾米特矩陣更為廣泛的正規矩陣是否也對?一個矩陣A如果其共軛轉置與它可交換,即A^HA = AA^H,則被稱為是正規矩陣 (normal matrix) 。對於埃爾米特矩陣A,由於A^HA = A^2 = AA^H,它也是一個正規矩陣。對於酉矩陣U,由於U^HU = I = UU^H,它同樣也是一個正規矩陣,然而許多酉矩陣並非是埃爾米特矩陣,如平面上的旋轉矩陣。可見,正規矩陣類比埃爾米特矩陣類大得多。


我很快發現,陶哲軒關於埃爾米特矩陣所證明的公式,可以一字不漏地證明對正規矩陣也成立,因為它們具有公式證明所需的一個共同性質,那就是埃爾米特矩陣及更一般的正規矩陣A都是可酉對角化的,即存在一個酉矩陣U,使得U^HAU是一個對角矩陣。


這個發現讓我的情緒開始高漲,並激起了強烈的好奇心,想知道對比正規矩陣更一般的矩陣,“陶氏公式”是否依然有效。因為可酉對角化這個性質是正規矩陣的一個特徵,我猜測對於非正規矩陣,這個公式不再為真。但是這時我的師兄回到了辦公室,我們需要出去吃晚飯了,然後去他家——以往我每次來訪,都住他家,就像他每次應邀來訪我係做報告時住我家一樣。


1986年1月3日是我到達密歇根州立大學讀書的第二天,那天上午當我第一次去我未來的博士論文導師李天巖教授的辦公室見他時,在門口先碰到了他來自韓國的博士生李弘九,從此我就和這位師兄建立了長久的友誼。他的名字中有“九”,而我的名“玖”則是大寫的“九”,所以我們生來就有親如弟兄的緣分。他和他的四兄弟中的三個,都是漢城大學(現叫首爾大學)的畢業生。除他之外,他的二哥也在美國拿到博士學位,後來成為總統李明博的科學顧問。在他於1987年拿到博士學位離開密歇根前,那個夏天我們兩人專門組成了一個討論班,輪流報告著名數值代數學家豪斯霍爾德 (Alston S. Householder) 所作的一本矩陣論名著。三十多年來,我們不僅一直保持親密的朋友關係,而且在過去的十多年中合寫了不少論文。


這次訪問堪薩斯城的週五,飯店晚飯聊天討論數學後,回到他家已經9點半,他建議我早點洗漱休息,畢竟那天早晨我3點多就離家開車90分鐘去的機場。在樓上的客房準備就寢前,我卻不想睡了,因為我急於想用自己的語言寫下對正規矩陣公式的證明。於是我伏案工作了一個小時,寫下了這個證明。


第二天早晨我起得較遲,因為前一天實在累了。我們決定早飯後去他的辦公室繼續討論數學,包括我已做好的關於正規矩陣的公式證明。我的師兄有很強的數學根底,李天巖教授也曾在我面前誇獎過他的數學。儘管他和他當護士的太太將人生的一大塊用於宗教活動,希望拯救一些人類分子的心靈,但他同樣一直保持著對數學的熱愛和對未知世界的探索激情。這一點他和我的大師兄、北卡州立大學的朱天照教授完全一樣;朱教授在他的個人網頁上這樣講:Teaching is my love, Research is my hobby, and Preaching is my calling.(教書是我的所愛,研究是我的嗜好,佈道是我的使命。)我對他們兩人的人生取向十分敬佩,可惜我卻做不到所有這些。


我們兩人週六的辦公室討論、思考及數值試驗,富有成效。在多年的合作中,我更多地擔當著思想者的角色,常有新奇的想法從腦子裡冒出,而他常以實踐者的面貌出現,在計算中時有出乎意料的觀察與發現。比如在將近十年前,我們在研究用最大熵方法計算不變密度函數時,正因為他在計算的實驗中發現了關鍵矩陣的奇異性,促使我想出了將有限元的思想與最大熵原則相結合的現代最大熵方法,一舉掃除了經典最大熵方法的病態問題,導致了第一個樣條函數最大熵算法的誕生。我的師爺約克 (James Yorke) 曾經說過:“計算可能導致偉大發現。”此話不假。這一次,師兄的計算驗證也加快了我改進埃爾米特矩陣特徵向量計算公式的步伐。


一到辦公室,李弘九就用他熟練掌握的MATLAB隨機地取了一個正規矩陣,一驗算就發現我所證明的公式正確。這裡還有一個插曲。當我從洗手間回到他的辦公室,剛剛完成計算的他對我說:“Jiu,your formula is wrong!(玖,你的公式不對!) ”我一聽大吃一驚,但我不相信這個斷言,於是請他給我再現計算過程。到了最後一步的檢驗階段,終於發現了一個下標錯誤,改正後電腦的屏幕上立刻出現了令人興奮的等號。


接著,他又隨機地算了一個矩陣,果然如我意料之中,公式不對。這樣我們對公式的本質有了進一步的認識。下面的事就是尋找公式的進一步的推廣。


陶哲軒證明公式成立的關鍵假設是可酉對角化矩陣A具有相互正交的特徵向量基底。比可酉對角化矩陣更一般的矩陣是可對角化矩陣。對於矩陣A,如果存在一個非奇異矩陣S,使得S^-1AS是一個對角矩陣,那麼A被稱為是可對角化的。這時S的所有列均為A的特徵向量,並且構成酉空間的一個基底。然而這些特徵向量一般不滿足所希望的正交性條件。缺乏特徵向量兩兩正交的有用性質,我同樣能獲得那個漂亮的等式嗎?整個週六,我都在思考這個問題。


當我沉浸於求解一個問題時,我的注意力都會高度集中,這是我在幾十年的學習和研究生涯中養成的習慣。在我以前所寫的文章《數學應該怎麼學》中,我強調了“專注”對於研習高等數學的極端重要性,把它列為讀書成功的必要因素。這時,我再一次得到了專注的眷顧。


我敏銳地注意到,陶哲軒對公式給出的第二個證明的思路可以繼續向前推進,但是它的敘述方式卻不易找到推廣的新方向。於是,我將矩陣視為有限維線性變換,採用了線性代數的“函數論”分析法:兩個線性變換如果在定義域空間的基底上給出同樣的結果,那麼它們相等。正如林開亮博士在刊登於《數學文化》雜誌上的一篇書評中所述,這種線性代數中的幾何論證法,在哈爾莫斯 (Paul Halmos,1916-2006) 的名著《有限維線性空間》及他的徒孫、我的老師阿克斯拉 (Sheldon Axler) 教授的教科書《線性代數應該這樣學》中到處可見。


與陶哲軒“共舞”的一個週末 | 數學家發現紀實


其實上述的推廣公式僅僅是我對任意可對角化矩陣獲得的一個等式的推論!它的另一個推論則給出了n乘n階可對角化矩陣的所有特徵值與它的n個(n-1)乘(n-1)階主子矩陣的所有特徵值的一個等式關係。雖然我從未見到過這個看上去也長得不錯的公式,但常常孤陋寡聞的我不敢相信我是這個關係的第一個發現者,或許頂多只是一個獨立的發現者,就像這一波數學新聞的主角那三個物理學家和陶哲軒一樣。


當我完全寫滿五頁紙的數學手稿,其中兩頁竟然是我出發前打印出的兩張登機牌的空白反面,並留下更多頁數的演算草稿時,我也快要結束我的堪薩斯城之旅了。這是一次收穫滿滿的旅行,不僅僅是因為我們師兄弟倆在兩年不見後再次相遇,也不僅僅聽我講座的研究生事後告訴他如何從我的演講中愛上了遍歷理論這門學科,更令我愉悅的是現代通訊支撐、中國騰訊發明的微信給了我再次被數學所激勵的動力和幹勁,讓我過足了充分滿足好奇心的癮!


與陶哲軒“共舞”的一個週末 | 數學家發現紀實

手稿的其中一頁 | 丁玖拍攝


週日下午,當和我一樣因與陶哲軒“共舞”一場而同樣興高采烈的李弘九教授把我送到歸程的機場後,我候機時突然想起了三十年前的一次數學之旅,不過它與旅行無關,更沒有微信的幫助。那年夏季,李天巖教授在教了我們幾個弟子一門一學年新課《[0, 1]上的遍歷理論》後,給了我一次練筆的機會,幫助他在其於日本京都大學所作的一系列演講稿的基礎上寫出一本計劃出版的書稿。當我寫到著名的“烏拉姆方法”以及他對一類區間映射的“烏拉姆猜想”證明這書中最後一章時,突然好奇心大發:烏拉姆方法用的是“逐片常數函數逼近”,作為計算數學專業的本科畢業生和碩士,為什麼不試試逐片線性函數或更高階的逼近法?於是我拿起紙筆,勁頭十足地演算起來,很快就大功告成,設計出兩類新的數值方法,並證明了收斂性。這項沒有“計劃經濟”指導的“市場經濟”產品,馬上成就了我的博士論文,儘管之前我已經寫出兩篇不同領域的文章。我在南京大學受過訓練的最優化理論出身,卻終於讓位於“計算遍歷理論”這一新興學科,讓我後來為此忙碌了三十年。


坐在機場的候機廳,我也想起另一次數學之旅。將近十年前,我讀到一篇楊振寧先生的採訪記,其中有他關於楊-巴克斯特方程的歷史描繪和“辮子解釋”,非常生動。讀後我想,如果將這個方程的每個因子視為矩陣,則可定義一類二階矩陣方程,不妨稱之為“楊-巴克斯特矩陣方程”,以示對這兩位老先生的尊敬,就像解非線性代數方程組的牛頓方法一樣。於是我拉上了我的李師兄,一起踏上好奇這個非線性矩陣方程解結構的挖掘之旅。我的大學同學魏木生率領他的弟子對一般的矩陣找到了這個方程的所有可交換解。


帶著對中西部平原有點依依不捨的離別心情,帶著對師兄太太為我準備精美健康早餐的美好回憶,我登上了飛向亞特蘭大的飛機。在萬米的高空,窗外是一片藍天,心中是一片陽光。是啊,如果時光迴流,我再年輕三十歲,我還會有許多可能不讓機會流逝,探索數學之美,滿足好奇之心,享受發現之樂。年輕的學子,你們生活在知識信息大爆炸的時代,你們有數不清的機遇,抓住它們,與之共舞,你的創造之源就會洶湧噴薄而出,你的智慧之光就會照亮前方。不管你的發現是大是小,不管你的結果是重是輕,最值得你自豪的,最值得你回味的,最值得你沉浸之中而忘掉一切的,最值得你孜孜以求度過時光的,就是你“吾將上下而求索”的整個過程。這就是我度過11月15日到17日這個週末的全部感想。


寫於2019年11月29日星期五


特 別 提 示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2. 『返樸』開通了按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。


《返樸》,科學家領航的好科普。國際著名物理學家文小剛與生物學家顏寧共同出任總編輯,與數十位不同領域一流學者組成的編委會一起,與你共同求索。關注《返樸》(微信號:fanpu2019)參與更多討論。二次轉載或合作請聯繫返樸公眾號後臺。


分享到:


相關文章: