專訪騰尚華教授:優秀的科學家該是什麼樣子?

雷鋒網AI科技評論按:從哈爾濱飛往北京的飛機上,筆者的身旁一個五十多歲的中年人一直在向鄰座的年輕人請教如何教育孩子,態度極為認真、謙虛、熱切。兩個多小時的行程,年輕人幾乎把他從當爸爸始到現在止所有的經驗和想法全部講給了他。

其實不止於此,筆者也曾有過類似這位年輕人此時的經歷。

在微軟亞洲研究院與哈工大共同舉辦的第十九屆“二十一世紀的計算”國際學術研討會(21CCC)午飯時間,當了解到筆者曾經從事過物理學研究後,這位中年人(一手端著飯菜)便站在那裡,向筆者詢問起引力波、暗物質等相關研究的前沿進展,十分投入,以致忘了手中還端著飯菜;十分熱切,以致筆者不得不搜腸刮肚把知道的全部內容都說與他聽。

专访腾尚华教授:优秀的科学家该是什么样子?

這位中年人就是南加州大學計算機科學與數學系教授滕尚華。滕尚華教授是國際上著名的理論計算機科學家,在理論計算機方面做出了巨大的貢獻,他和耶魯大學的Dan Spielman教授共同提出的平滑分析理論使他們獲得了2008年的哥德爾獎;2015年,兩人在線性時間拉普拉斯求解器方面的研究再次使他們獲得當年的哥德爾獎。(哥德爾獎的獲獎者必須在理論計算機領域具有開創性的重大貢獻,同時其研究論文須在獲獎前14年內正式發表在學術期刊上。——wikipedia)2009年,滕尚華教授當選為美國計算機協會院士,同年獲得由數學規劃學會和美國數學學會頒發的福爾克森獎。

专访腾尚华教授:优秀的科学家该是什么样子?

滕尚華教授作為特邀嘉賓,參加了21CCC的大會,並做了《大數據和網絡分析的可擴展算法》的報告。會後雷鋒網有幸採訪了滕尚華教授,瞭解了他的求學、研究生涯的一些細節、和Dan教授之間的合作、相關工作內容以及他五歲的女兒的教育。

內容速覽:

1、本科學了三個專業的課程,在以後的研究中不會把自己侷限在任何一個單一的學科裡面;

2、做研究必備好奇心和興趣,這兩者甚至大於學位本身;

3、天才之間的相識與合作;

4、平滑分析、線性時間拉普拉斯求解器的工作過程及簡介;

5、對女兒的教育與觀察,女兒成為他生活和工作的重心之一。

以下內容為雷鋒網在不改變原意的情況下的精簡和編輯。

一、求學、研究生涯

雷鋒網:能否介紹一下你的求學經歷?

騰尚華:我在中國時是在上海交大讀書(注:85屆),學的計算機科學。當時上交大正在做教育改革,我們一共18個學生作為第一批優異生,當時我們可以選兩個專業。我本想選數學加計算機,但還沒有數學的選擇,所以就選了生物和計算機。當時每天我都要到華東化工學院去上生物化學的課程。但後來我決定不學這個專業了,校長把我的學分轉到電子信息,所以最後一年我基本上要上兩倍的課,把電子信息需要學的全給補完了。所以我當時拿到了這兩個學位。

但是到了美國以後,我基本上一直在做計算機的研究,先是計算機系統結構;一年後我覺得我更喜歡數學了,因為我發現我動手能力並沒有那麼強大。

雷鋒網:感覺您現在的知識背景(包括靈感來源)蠻複雜的,有經濟學、數學、計算機等等,請問您是如何做到的呢?

騰尚華:

首先可能是因為我當學生時候學的內容比較廣,所以對什麼都感興趣,感興趣了就會去了解一點。

其次,就是你要去不同的講座,很多靈感都是從別人那裡來的,如果只侷限在自己看的幾個問題上就會比較狹隘了。美國這點就很好,它有很多講座。你去參加會議,坐在那裡多半也聽不懂;但偶爾他講的,你會覺得很有想象力,然後你就會自己多讀一些相關的內容。知識就是這樣過來的。

雷鋒網:你覺得做科研需要哪些必備的品質?

滕尚華:我覺得總體還是好奇心。當你好奇一件事情的時候,會讓你長期去想這件事情。因為任何一件事情,你剛剛看的時候都覺得好像很多問題都被別人做掉了,剩下的問題太難了。每一代人都這樣想,我這代人看我老闆那代人,他們都把那麼簡單的問題做掉了,都變成名人。但是實際上在他們那個時代並不是那麼簡單的事情。每代人的平臺不一樣,他一直在想一些事情的時候,可以經常找到前一代人沒有想到的問題,或者前一代人沒有想到的辦法。但是能夠找到這個,往往就是他個人覺得自己要做出來的事情。

其次是興趣。當時我在CMU有一個印度同學,他在印度的時候一直都是總統級的獎,最好的學校。博士二年級的時候他去英特爾實習,然後給我打了一個電話說:我很喜歡Pentium,我不想回去了。

我說:你瘋掉了嗎?你在全世界最好的學校,你再努力兩年就畢業了。

他說:我大概要留在這兒(注:英特爾)了。

這是1990年的事,我是1991年拿到的PhD。1994年有一天他給我打個電話說:你要不要來英特爾?我現在需要對算法很精通的人。我想了半天,就只認識你,下個學校你多少工資,我給你兩倍。

我去了英特爾,發現他自己創建一個實驗室,帶領了120個博士。他當時寫出了英特爾Pentium的全部內容,但是他自己沒有覺得他自己必須要做博士。

當年把整個Pentium全部模擬出來是非常不可思議的一件事情。你可以看到他對這件事情非常熱忱。一個小小的研究生,這麼幾年就做出這麼大一個模型。

二、天才之間的相識,是緣分還是必然

雷鋒網:你和Dan Spielman是怎麼認識的?

滕尚華:這都是年輕時代的事了。Dan在大學二年級的時候就做出一個很偉大的論題。所以很多學校都要邀請他去做博士生,CMU也想,所以就先請他去做了個交流。當時他才20出頭。我作為理論方向的學生,當時系裡拿出400美元讓我管他兩天的生活。事情過去了也就沒有多想了。

後來我去MIT做一個演講。我剛到,坐在辦公室裡頭,面對著門。一個小孩走了過去,然後他又倒了回來。他說“我認識你,但想不起來在哪見過了。”後來我倆終於想起來,我曾經是他的東道主。我們一起去吃了個午飯,順便聊了聊正在做的問題。所以實際上,我們先成為朋友,然後才考慮很多共同的問題。很偶然,但是有一些必然。

雷鋒網:在科研上你們兩個一直都有合作嗎?

滕尚華:對。你喜歡跟一個人講一些事情,就會講的多一些;尤其他是那麼超群的人,這不是百裡挑一,而是百萬裡挑一的才智。所以,正好我們共同喜歡一些問題,就會經常講一講,講的多了有些時候就有點憷頭。並不是每個問題都做出來了,但還是做出了一些。

不過最近稍少了一些。我女兒出生以後,我實際上在孩子身上花了很多精力。不像以前我就住在他們家,整天都在一起。 再過兩年我女兒可能不理我了,所以我要想想以後要跟誰講話。不過現在她跟我講話,所以她是我現在最大的合作者。

三、兩次獲得哥德爾獎的工作

雷鋒網:您當時是否是根據計算機算法中的實際問題選的課題?

滕尚華:理論和實際總是有很大的距離的。這個距離有時候是好事情,有些時候也是壞事情。好事情就是說它給做理論的人一個小的自我空間,這樣你可以更加有想象力,你可以想一些事情,它不一定馬上就產生影響。所以做基礎研究會考慮一些問題,有些時候有長遠的想法,但是更多的時候並不會去想20年、50年以後會有什麼影響。多半做理論還是,你個人覺得很美。美和有用不一定相同,而且很多場合下是這樣的。

要麼你特別喜歡這個問題,要麼這個問題的猜想讓你很有想象力,或者他會牽扯到一些數學你覺得很奧妙,這些都是做理論的動力。但是偶爾有些時候,也會考慮一些實際應用的問題,尤其是計算機方面。當然,雖然是從實際出發的,但是作為理論家,更會考慮到這個問題是不是漂亮。偶爾某些東西你突然想對了,事後人們說這個想法是長遠性的。

雷鋒網:能否介紹一些您和Dan教授在2008年第一次獲得哥德爾獎的平滑分析的工作?

騰尚華:當時理論界長期在分析算法的時候,採用的方式都是最壞情況分析(worse case analysis),就是用算法的最壞情況來評估算法。這就相當於你用一個班級裡面考試成績最低的同學來評估整個班級的水平一樣。其實大多數情況下,都可以做得比WCA更好。我們的出發點是,實際的數據總是一個很精確的東西加上一個概率性的變量。所以你要解決實際問題,那麼你就必須說這個算法在實際中它的性能是什麼樣的。我們就希望至少有一些理論,做實際的人認為不是那麼空想,而且理論的一些設想是符合實際的。

雷鋒網:能否介紹一下2015年第二次獲得哥德爾獎的線性時間拉普拉斯求解器的工作?

滕尚華:實際上這個問題本身是蠻久的問題。最初也不是我們在看的問題,這個問題實際上是和很多人的經歷都有關係的問題。我們上中學的時候學物理時會有一些電路的知識,並聯或者串聯、加壓/減壓時電壓、電流多少,怎麼變化等等。這個算法實際上是線性的。這個問題其實出現在很多地方,包括社交網絡分析、機器學習等,都可以歸結到這個電路圖上,當然此時這個“電路圖”已經不再是並聯、串聯了,它可以是任意連接;但類似的問題仍然存在。

在複雜電路中,我在一些地方加個壓或者減個壓,電流會怎樣變化?這個問題人們一直沒有很明朗化地提出來。但是這個問題很奇怪,算法做了那麼多年,一直不能做到線性時間。90年代有一個人提出了一個算法,他把當時的算法改進了一些,用到圖論中一些很奧妙的東西。我們當時只是覺得他用圖論中的這個東西很有趣,我們就想,它會導致對圖論的哪些理解呢?

這件事情我們當時花了很多年,看不同的論文。後來我們就想到了一些策略,能夠把這個電路的問題給線性時間求解出來。解出來後,突然就有其他人說這個和他做的問題很像,例如可以用到社交網絡、機器學習等方面。機器學習實際上也是類似一個電路,只不過稍微有點不同。他們一直也在研究怎樣找到一個函數來刻畫整個圖,於是就把我們的工作拓展到他們的領域中了。

所以,這也是我剛才講的,我們做這個的時候,並沒有想要用這個東西去改變世界,只是因為當時覺得數學很漂亮,想要去推進這個問題。

我們算法出現以後,2005年左右,我們又改善一點。這些算法現在已經完全被改善了。年輕人如果回頭去看我們當時的結果,可能會說:你們怎麼這麼笨,做成這樣子。但當時黑暗的時候,我們也看不清楚在什麼地方,就自己打個手電筒嘗試這件事情,所以當時就是這樣構造的。事後人們再看的時候,會說還有其他的捷徑。

四、女兒成合作者和觀察對象

雷鋒網: 在很多場合下,都聽到您介紹您的女兒,言語之中滿滿的喜愛之情。咱們能否談談她?

滕尚華:可以。我女兒現在剛剛5歲,也算是老來得子吧。我周圍的朋友他們的小孩都已經上大學了。他們給我一些建議,很簡單,就是:少做點科研,多跟小孩玩一玩。看一個小孩成長,尤其是在當今機器學習、AI迅猛發展的時候,實際上我覺得是很有意思的一件事情,因為我可以看到這個小孩子怎麼能夠迅速的學到一些東西。所以有些時候,一些機器學習的東西,我自己知道一些理論或者是算法,我可以看看小朋友是怎麼去想的。

不過更多時候是沒有辦法知道的。因為小孩的發展非常迅速,你覺得你好像猜到她會怎麼樣做。第二天她就會給你另一個驚喜。

但是,很多時候我還是可以看到她怎麼樣去擴展化的。怎麼樣從很多或者很少的數據裡頭突然轉變。我經常可以看到的這樣的事情在我女兒身上發生。

雷鋒網:能否講一講你女兒成長過程中的一些事情?

滕尚華:我經常會跟其他人講我看到的一些東西。尤其是一些小故事,你突然覺得她怎麼會達到這個地步。有一次剛會講話的時候,我給她讀一本動物書,她突然就會說,老虎。有一頁我打開以後,書角底下有一隻蠍子,她很激動,指著它說“恐龍”。因為她從來沒有見過蠍子,在她看到的所有動物中這個動物最接近的確實是恐龍,所以實際上她是正確的。

以後知識越來越細分,剛開始這也是所謂歸類,學習就是你怎樣歸類的過程,所以她看到一個沒有看見的東西,也會確認這件事情,說這個是恐龍。所以我有時候會說,這個和機器學習比較接近。

雷鋒網:是您女兒影響了您,讓您學機器學習、人工智能這些方面嗎?

滕尚華:在和別人交流的時候我會想到這些。就像別人在講,怎麼樣做自然語言處理。以前我也就聽朋友講講自然語言處理怎麼做的,但現在我自己有了一個很具體的自然語言處理模型,所以我能直接進行觀察。

例如英文和中文的學習和表達也是自然語言處理。我太太不講中文,而我非常希望我女兒可以講中文,所以從她出生以後我基本上沒有給她講過英語。很多時候我都能在我女兒成長中很明顯地看到中、英之間的影響。所以別人再講自然語言,我就會和以前不一樣了,而會去參考我女兒的學習。

所以就像很多理論學家,有些生活中的事情,當時你可能沒有想到會改變你的科研方向,但是潛移默化地還是改變了。 我很好奇,兒童在學語言的過程中,到底是怎麼去處理這些不同語言的轉換,到底一個語言對另一個語言有什麼樣的影響?我覺得這裡頭有很多AI或者機器學習的問題。所以我會讀很多我之前做科研不會讀的一些論文。最近這五年,我花了至少1/3的時間在讀一些和我的研究沒有關係的文章上。從這個意義上,我女兒也算是我的合作者吧。

和滕尚華教授的接觸,對筆者一個極大的感觸就是:優秀的科學家之所以優秀,必有其優秀的原因;他就像一個有吸引力的知識漩渦,和他交談的人都願意傾吐自己所有的知識。


分享到:


相關文章: