楊強:遇見更好的自己

作者 | 王之康

杨强:遇见更好的自己

楊強

人之所以要讓自己不斷提高、之所以愛學習,就是因為有興趣,而興趣的來源則是好奇心,要不斷地去問為什麼。

他擅長木工,不少朋友家裡都放著他做的小傢俱,比如放杯盤碗盞的架子、放香料的盒子等;他也愛運動,鐵人三項比賽中時常能看到他的身影,在10月27日舉行的2019成都馬拉松中,他還跑出了個人半馬的最好成績——2小時06分;他還是人工智能領域的專家,不久前獲得了第九屆吳文俊人工智能傑出貢獻獎,全國僅有三人獲此殊榮。

很難想象,這麼多不同領域的標籤,卻可以同時出現在一個人身上——他就是微眾銀行首席人工智能官、香港科技大學講座教授楊強。

說起來,楊強起初是要成為一名物理學家的。至少,他的家庭氛圍以及最初的專業選擇,顯示出了這種跡象。

物理學的根

1978年,作為恢復高考後的首批大學生,楊強進入北京大學地球物理系天體物理專業。之所以選擇這個專業,用他自己的話說,“從小受父親的影響”。

楊強的父親畢業於清華大學物理系,是一名天體物理學家,後來在北大工作;母親畢業於北大圖書館系,後來在清華工作。他從小所接觸的“朋友圈”,不是研究物理的,就是研究圖書館的。

他對天文學情有獨鍾,因為從小就和父親去看望遠鏡,經常參加父親的北大講座,家裡也經常有客人來討論天文學。

“還有一個原因,就是我特別羨慕父親出差。”楊強告訴《中國科學報》,他父親當時經常出差做天文觀測,每次回來都精神抖擻。

“比如,他每次去雲南天文臺觀測,要坐三天火車,在那兒一待就是一個月,每次回來都會給我講很多故事,我就覺得他好幸福啊!可是現在發現,出差是個苦差事,這是後話。”

時間一晃,轉眼就到了1981年。

當時,CUSPEA項目進行到第三年,已有來自中國科學院、中國科學技術大學、北京大學等高校、院所的19名學生通過該項目去到美國,攻讀物理學研究生。

本來,一般只有大四學生才可以參加CUSPEA考試,但CUSPEA允許大三學生通過一個預考進行篩選,其前五名有資格參加考試。

如今回想起來,楊強依然對那次考試記憶猶新。“雖然我大三就參加考試,即使沒有通過,也還有機會第二年再考一次,但備考過程還是不敢放鬆,整個夏天都是在圖書館裡度過的。”

那段時間,他每天都處於做題的狀態,把以前的題拿來重新做,把物理書後面的所有題都做一遍,同時也找各種各樣的物理書來做題。

參加前兩屆考試的學生憑記憶寫下來的考題成為“暢銷品”,當時還有一本特別著名的Halliday and Resnick所著的物理書叫Fundamentals of Physics,雖然特別厚,但誰拿到都不肯輕易讓給別人,直到從頭到尾全背下來才肯罷休。“就像參加第二次高考一樣,非常辛苦。”

不過,與筆試相比,更讓楊強感到緊張的是面試。

“面試是在北京友誼賓館進行的,由美國的一些大學教授和他們的夫人來考我們。”楊強說,教授會當面問一些物理問題,他們的夫人則會問一些生活問題。“以前從來沒有這樣跟外國人對話過,而且當時學的都是英國口音,但他們用的都是美國口音。不過緊張歸緊張,所幸後來還是通過了。”

後來,因為面試人中有一位是來自美國馬里蘭大學做固體物理研究的Anderson教授,所以作為唯一通過考試的大三地球物理系學生的他,後來選擇了這所學校,師從做恆星物理學研究的Wentzel教授,繼續攻讀天體物理學研究生。

循著這樣的求學軌跡,楊強將會一步一步成長為物理學家。但事實是,在馬里蘭大學,他改變了人生航向。

計算機的果

在馬里蘭大學攻讀碩士研究生期間,楊強研究的是太陽物理,主要是通過NASA(美國國家航空和航天局)發射的衛星觀察太陽上的一些活動,比如耀斑。

“問題也就隨之而來了:耀斑的發生機制是什麼?怎樣建立一個模型去預測它或解釋它?”楊強說,要解決這兩個問題,他需要做兩件事:一是用物理學的理論建立一個模型,把耀斑爆發的整個過程模擬出來;二是用計算機實現模擬過程。

由於物理學上的研究需要,楊強開始接觸計算機,這讓他迎來了人生的轉折點。

在接觸計算機的過程中他發現,首先數據是極端缺乏的。

天體物理需要很多數據都要通過衛星去採集,但衛星有時候發射不了,一等就是幾個月,這讓他感到“自己的人生掌握在別人的手裡”,而計算機卻可以通過衛星圖像自行產生數據,不用去等。

“其次是計算機真的很有意思。”楊強說,計算機的很多流程都可以自動化,可以用學習的方式來解決。“如果我能成為一個‘碼農’的話,就能像上帝一樣創造一些東西,掌握自己的實驗進程,做各種各樣的測試。”

於是,他萌生了轉學計算機的想法。

基於自己對計算機產生的濃厚興趣,楊強就去問計算機系的學生,是否他們也學得如此開心。得到的很多答案卻是否定的。

他們整天都在研究數據庫、軟件工程、計算機語言等,那些都是相對邏輯化、內容比較枯燥的工作。“但有一個分支非常有意思,就是人工智能,試圖讓機器像人一樣做事。”

後來,他去聽了幾次計算機研討課,感覺計算機與物理學很像,“但好像比物理學更偉大,因為人類對於人的大腦瞭解甚少,當時處於一個前沿階段,做這方面研究的人也很少”。

在後來的導師Dana Nau的辦公室門口,他曾看到一張海報,上面寫著“Too many lawyers,Too few engineers”(律師太多,而工程師太少)。

之所以這樣寫,是因為二戰後,美國很多有經驗的工程師都要退休了,所以當時美國面臨大量專業人士缺乏的社會問題,而人們認為解決這個問題的辦法,就是用人工智能來頂替人。

當時,正好有一個學生說他導師那兒缺一個人工智能的科研助理,楊強就去面試而且被錄用了。

在多種機緣巧合的共同作用下,楊強轉到了計算機系。不過幾家歡喜幾家愁,計算機系向他敞開了大門,但物理學的老師卻很不高興,比如他的導師Wentzel教授。“因為他覺得計算機更像一門技術,物理學才是科學。我覺得他說得不對,而且我的興趣已經改變了。”

話雖如此,但實際上,他轉學計算機早就有因可循了,可以追溯至在北大讀書時期。

種子早已埋下

在北大,由於專業需要,楊強時常會做一些天文觀測,用計算機分析射電望遠鏡的頻譜,而且這也是他畢業論文的一部分。

“我當時用的計算機是用一臺9英寸電視連接一臺日本打遊戲的主機做成的,第一次學的是BASIC,感覺很有意思,學得廢寢忘食。”楊強告訴《中國科學報》,在北大做畢業論文的時候,他聽說清華應用數學系老師留美歸來後開了一門計算機大課,教計算機語言等,就讓他母親幫忙搞到一個名額。“我記得當時學習特別累,但還是每天利用午休時間跑去聽課。人很多,有時候擠都擠不進去,只能踮著腳在人群中露兩隻眼睛。那時候學生特別好學。”

本科畢業前夕,有一門物理實驗課,天體物理專業的學生沒有去上,但物理系的學生都上完了,他就向學校老師申請單獨去做實驗。後來終於做完了,但這個過程卻讓他感到很無趣。

“我覺得不能一直幹這個事,如果一輩子都跟父母做的事情一樣,人生豈不是太悲哀了?我要有自己的路、跟他們不一樣的路。”他說,人生的路不是一個事件來決定的,如果當時沒有去美國,即使在國內,也會轉到人工智能。“如果你對一個東西感興趣,機會是會不斷到你跟前來的。”

不過,楊強到了美國之後才知道,轉專業這件事到底有多難。

杨强:遇见更好的自己

1987年,楊強(左)和父親在美國華盛頓。

1984年前後,他對計算機產生興趣,就一直在用自己時間補課。

正常的計算機課,在學期中間是註冊不上的,因為學的人太多,根本沒有空餘位置,甚至想旁聽都沒有站的地方。所以,他只能利用夏天的時間選修一些課來惡補。

“我真正開始熬夜就是從那時候開始的。”楊強說,他出國前的視力非常好,但為了趕計算機那些動輒上千行代碼的大作業,他不得不經常熬夜,導致視力下降,最終才戴上了眼鏡。

讓他記憶特別深刻的,是一門叫《操作系統》的課,給學生一臺裸機,讓他們通過按鍵的方法,把1和0敲進去,最終實現打印等目的。

“但是那個機器經常壞,有時候敲的是這個鍵,出的是另外一個字。不過當時情況就是這樣,壞的機器也得用,而且是排隊用。經常晚上三四點才排到我。”楊強說,上那個課是要脫層皮的,所以大家給它起了個名字,叫Dead Class(死亡課程)。“我從來沒見過物理學有那樣的課程,晚上教室裡燈火通明,學生在外邊排著隊。”

除此之外,楊強發現馬里蘭大學還有晚上給成人班上的計算機課,於是他就選了。

後來因為學得好,他還被授課老師選為TA(Teacher Assistant,即教師助理)。有時,那位老師太忙沒時間來教課,就讓他代課。

在1985年轉到計算機系之前,楊強其實已經在教三門計算機課程——數據結構、電路設計、人工智能。也正因此,他後來轉學計算機時非常順利。

做一件偉大的事

說起來,楊強所經歷的人工智能要分成前後兩個階段:前半部分是以專家系統為主的思維,即先入為主,人用計算機的邏輯語言把人類的專業知識輸入計算機,這是專家系統的模式或者說邏輯推理的形式,也是他讀博期間所流行的;後半部分則是機器學習(包括深度學習),即不是先入為主,而是通過對事件和環境的觀察、通過訓練數據,學到一個模型,再付諸實施,預測未來。

“我讀書的時候,後半部分雖然已經開始了,但還沒有得到大力發展,因為當時大家覺得那是非主流。”他說,前半部分的專家系統和邏輯推理特別像物理學裡的讓科學家來建模,雖然物理學積澱所帶來的想象力足以讓他在建模速度上秒殺計算機系的學生,但也給他帶來一定阻礙。“物理學家的先入為主而非觀察來反推,是與現在的深度學習模型背道而馳的,所以學物理的學生來學計算機可能會受到影響,我就見過幾個學生半途而廢了,因為先入為主是他們思維裡的一個障礙。”

對於這個障礙,楊強動手做了很多實驗,參加了很多比賽,用了很長時間才克服。“比如2005年,我們參加了一個叫ACM KDD CUP(國際知識發現和數據挖掘競賽)的比賽,動輒給參賽者幾百萬的數據量,讓大家去建模,最後在一個公平的平臺上去比賽。像這種比賽,是真正能體現數據思維的。”

在他看來,對於機器學習來說,當有足夠數據的時候,模型越複雜越好,因為預測的任務往往跟社會相關,而人的社會關係又是極端複雜的,不可能用一兩個簡單的公式來描述。

雖然物理世界也是複雜的,但它的目標是用盡量簡單的公式來描述,這是兩者本質的區別。

大概從在加拿大滑鐵盧大學任教開始,楊強1995年得到了終身教授的職位,擁有了相對自由的時間和基金項目支持,便開始了後半部分的研究,即機器學習。

他發現,當時人工智能有一個很小的分支,同時具有機器學習和邏輯推理的特性,即基於例證的推理(Case—based Reasoning),不少哲學家和心理學家也參與其中。

大家發現,人往往可以從一兩個例子中推理出道理,然後舉一反三。人工智能的研究者就試圖去複製這一現象。

“我們希望通過數據來說話,但不足之處在於,在上世紀90年代,數據太少了。”楊強打了個比方,人們總是驚歎於兩三歲小孩學語言的能力,實際上,他們並不是基於一兩個例子學到的,而是已經有了很多積累,這種積累源於他們出生時,就已經得到了父母賦予的大腦中很多知識的連接,“只不過有些還沒有連接上,需要一兩個例子來刺激完成”。

其實,這就是楊強後來提出的遷移學習的基本模型,可以把大數據領域的知識遷移到小數據的領域來,解決小數據的問題。

在他看來,機器學習離不開舉一反三的能力,即遷移學習;同時也離不開連接數據孤島的能力,即聯邦學習,後者解決的是數據割裂和用戶隱私的問題。在大數據時代,只有合作才能看到更多數據,但這種合作不能簡單粗暴地進行,而是要兼顧隱私保護。“我們所做的聯邦學習,對於隱私保護、數據安全是一個世界性的貢獻。”

如今,作為微眾銀行首席人工智能官,楊強希望把整個金融服務設計到一個人工智能的模型裡,這個模型可以自動變成一個銀行,然後把這個銀行的模型開放給各個行業,讓每個行業都有可能自己去做有金融特性的服務。

“我覺得這是特別偉大的一件事,可能需要很多年來做。但每每想起目標的偉大,我都激動得睡不著覺。”楊強說。

讓自己跟昨天不一樣

從馬里蘭大學畢業後,楊強曾先後在加拿大滑鐵盧大學、西蒙弗雷澤大學、微軟亞洲研究院、香港科技大學任教或從事研究,其間曾出任華為諾亞方舟實驗室創始主任,還是第四範式公司的聯合創始人,並於2018年加入微眾銀行,建立AI部門。

面對一次次的人生選擇,楊強認為自己所遵循的原則其實很簡單,就是“不斷學習,不斷提高自己,讓自己跟昨天不一樣”。

“在大學工作時,我給自己一個挑戰,就是成為行業領袖,知識也要不斷提升。”他說,成為Full Professor(正教授)之後還有Chair Professor(講席教授),再後面還有University Professor(特聘教授),“這些教職都獲得之後,我覺得沒了目標,周邊能學的東西幾乎都學到了,所以就要換個‘朋友圈’”。

在他看來,人之所以要讓自己不斷提高、之所以愛學習,就是因為有興趣,而興趣的來源則是好奇心,要不斷地去問為什麼。

楊強曾帶過一名碩士研究生,畢業後將前往美國卡耐基梅隆大學攻讀博士,臨走前尋求他的建議。學生問完之後告訴他,自己錄下了整個對話,如果不讓錄可以立即刪掉,同時他還錄了與卡耐基梅隆大學很多著名老師的對話。

楊強沒有讓他刪掉對話錄音,而是問了一個問題:“這些人的話有什麼共性。”學生告訴他,大家都談到一點,就是“會問問題和愛問問題比會解問題更重要”。

“實際上,Learning how to learn(學習如何學習)正是機器學習所需要的能力。”楊強說,當然人也需要這個能力,比如兒童教育,教小孩如何有效地去學習,永遠都比不過讓他對什麼都好奇。“一個孩子的好奇心可以通過讀書來培養,就像我父親在我小時候就有意培養我的好奇心,經常拿一些魔幻小說給我講。”

現在,機器沒有好奇心。但楊強希望,以後在這方面多一些探索,實現一個大跨越,不僅讓自己,也讓機器跟昨天不一樣。

CUSPEA即中美聯合招考物理研究生項目,是諾貝爾

物理學獎獲得者李政道於1979年提出的,此後十年間,這套特殊的留學制度將900多名優秀物理學子送到美國名校求學深造。

40年過去,他們成長為我國乃至國際上科學教育戰線及科技創新領域一支非常可觀的力量。

2019年是CUSPEA40年,我們有幸採訪了部分當年赴美留學的優秀學子,試著用他們不一樣的人生故事,來銘記這一段科技教育史上難得的佳話。

並以此向CUSPEA發起人李政道先生,以及所有為該項目順利實施做出過貢獻的人們致敬。

《中國科學報》 (2019-10-30 第5版 學人)


分享到:


相關文章: