數學有什麼用?丘成桐:AI和大數據的未來都得靠它!

數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


出品| 新浪科技《科學大家》

撰文| 丘成桐國際知名數學家,菲爾茲獎首位華人得主,美國國家科學院院士、美國藝術與科學院院士、中國科學院外籍院士


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


中國的大部分家庭,每個家庭都很用心於孩子的教育,都很關注孩子的健康成長。基礎科學的發展也是同理,我們不斷投資在工業上,也將可觀的經費投資在基本科學上,因為強大的基本科學對於一個國家的獨立自主長治久安是必須的,沒有基本科學的發展,研究科學發展不起來。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


當年我在普林斯頓高等研究所當教授的時候,這也是楊振寧教授、愛因斯坦工作過的地方。當時的所長曾很自豪地說:“我們在這裡研究的是無用之學!這些無用之學在未來將會成為社會的磐石、國家的棟樑。”


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


高研所第一任所長叫A·Flexner,1939年他在雜誌上發表了一篇題為“無為知識的無所不為”(The Usefulness of Useless Knowledge)的文章,文中指出:19世紀法拉第和麥克斯研究電磁學,不過是出於科學的好奇心,接著Hertz發現了電磁波。這些科學家並不重視電磁在人類社會中的應用,但是他們的工作卻如此重要,不單單是在理論科學劃時代的成就,同時也是近代文明的一大貢獻。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


基本科學跟數學有哪些應用呢?在當今社會,互聯網和計算機的能力極大,無論能源的分配、大數據處理物流系統、道路交通、仿真神經元、蛋白質結構等問題都需要大量地提升計算能力。這種能力有相當大的部分是依靠計算機芯片存儲的。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


隨著電子計算機計算能力的不斷成長,30年來,摩爾定律已經到了極限,不可能再增長,計算機硬件的設計將要面臨極大的瓶頸問題!

兩個方案來解決計算機瓶頸

如何解決呢?

解決的辦法有兩個,一個是利用基礎物理的原理和基本數學來大力改革硬件設備;另一個是大力改善軟件,即找到最好的算法,來繞過硬件速度和儲存能力來解決計算機瓶頸。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


針對第一個方法,三十年前,偉大的物理學家理查德·費曼就提出量子計算這個方案,利用量子力學的基本原理來幫助計算,但當時費曼也不是特別清楚該怎麼做,但他知道量子力學的基本原理能解決計算儲存能力的問題。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


直到二十多年前,MIT有位應用數學家叫Peter Shor,他提出一個算法,利用費曼的提議做大數字的因子分解,在小學我們都學過因子分解,但是大數據做因子分解是一件很困難的事情,基本上大部分的保密系統就僅僅利用大數據分解困難這個問題來設計的。

1978年,科學家提出了一個很出名的方法:RSA加密算法,到現在所有系統都用這一個方法,但是Peter認為假如量子計算成功的話,RSA所有的加密方法都可以破解。

因為量子計算威脅到目前通用的保密方法,因此很多國家的政府官員、銀行監管部門等都極為擔心,但同時也投入了大量的資源來發展研究量子計算。

這項研究需要大量的數學家、物理學家跟工程師合作:費曼是物理學家,Petter是數學家,美國名校有很多教授在做這方面的工作,MIT、斯坦福,在實驗方面投入的資源很大,美國公司投入的規模更大,包括IBM、谷歌、微軟等公司在內,IBM投入量子計算研究已經幾十年了,現在有1300名工程師在做這方面的研究。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


2018年,美國通過了National Quantum Initiatives(NQI)法案,許多智庫與政府官員都認為量子計算就像二戰前的曼哈頓核彈計劃一樣,關係著國家安全,需要政府全力支持。

今年IBM研發出53個量子比特的超級量子計算機,可以通過雲端使用,最近NASA宣佈,谷歌可以通過量子計算在200秒內完成世界第一的Summit超級計算機在10000年才能解決的問題。

中國的學者和公司也在做這方面的工作,但是基本物理和基礎數學的水平不如美國,要在量子計算的研發上努力追上他們。這其實也給我們一個很重要的啟示:投資不能看五年十年,甚至要看二十年,因為IBM投資在量子計算的時間至少超過了20年。

第二個解決方法就是利用數學發展出來的方法,現在這方面研究有人工智能跟大數據。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


人工智能已經從一種剛開始的理念,逐步轉化為可應用的技術。30年前大家都不看好人工智能,現在已慢慢轉化成認為可應用的技術。人工智能的蓬勃發展基於三個重要因素:一是互聯網技術帶來的大數據;二是利用深度學習的標準算法來處理數據;三是超級計算機跟雲計算的強大計算力。

然而其中的數學理論卻沒有什麼很大突破,這也是該領域存在諸多瓶頸的本源。中國的人口規模是發展人工智能的優勢,在應用人工智能技術方面已經有了很多優秀的工作,發表的論文甚至比美國還要多,處於世界前沿水平。

但是在基礎理論和算法創新方面跟美國、英國還有一段距離,因此我們要像在人工智能方面領先,基礎理論一定要突破。要想突破,一定要將數學跟相關的學科一同發展,才能夠真真正正地領先。

人工智能對大數據的處理,本質上是數學中的統計學,然而目前還沒有完備的數學理論能支持大數據分析的結果,很多數學方法還相對原始,過度依賴於經驗的總結,而非真正來自內在的數學結構。

這也導致了當下人工智能在處理大數據問題時還需要大量的人力和算力,甚至需要超級計算機的協助。由於缺乏數學理論的支持,很多大數據分析的結果只適用於特定環境,缺乏遷移性。


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


大數據還缺乏有效的算法,經典計算機的算法還不能直接用到大數據中。這是很重要的一個問題,我們要深入瞭解。

廣為流傳的深度學習有很多不足的地方,例如大樣本依賴,可解釋性差,易受欺騙等,但當前沒有更好的算法來替代。要解決這些問題,就需要對相關數學理論進行深入研究,瞭解大數據內在的數學結構和原理。

目前人工智能由於計算器速度限制,只能採取多層狀結構解決問題,基於簡單數學分析而非真正的Boltzmann machine,無法有效地找出最優解。

在可見得未來,如何提升量子計算機的硬件,發展更有效的數學算法,讓量子人工智能與量子深度學習變成實用工具,這有賴於基礎科學和數學的深度結合。

幾年前,我的學生和我朋友發現我四十年前在幾何方面做的研究,可以應用到人工智能的理論研究上,以前其實沒有想到的基礎科學可以用在這方面。由此可見,基礎數學在工程問題上確實是重要的。

機器學習和人工智能等先進的計算方法,已經在零售和娛樂等領域帶來了顯著的突破。這些方法也可能對醫學和衛生保健產生深遠的影響,全球的衛生保健系統包括美國和中國,都著手將臨床信息數字化。

但是,對如何分析和應用這些信息卻還沒有很好的策略。未來十年,數據科學和人工智能對醫學的貢獻可能超過其他所有技術的總和。人工智能和數據科學的醫學研究將變成醫學和衛生保健的一個新領域。在這個嶄新的領域裡,數學和計算科學將會更廣泛地為醫療決策提供支持。目前很多醫療系統的研究人員還沒有意識到這一點,或者低估了這些影響。

我們希望將最先進的計算技術應用到大型的、醫學相關的數據庫,得到有效的信息,並將之應用到醫療服務、臨床診斷及相關的醫學研究中。

為了將人工智能和應用數學更好地應用到醫學研究和衛生保健上,不同的學科需要共享合作。數學、醫學信息學、計算機科學、生物統計學、工程學都將是研究工作不可或缺的。這將是一個很大規模的不同學科聯繫起來的一種研究,不同的學科共同的努力才能完成,不是一個學科就能夠完成的。

以人工智能臨床診斷為例,中國擁有全世界最大的臨床醫療數據庫,我們需要學習如何管理和應用這些數據,而通過計算科學和人工智能,我們可以用全新的方法利用這些數據,推動整個領域的發展。

首先,我們可以利用機器學習模型消化更大、更豐富的數據集,同時通過機器學習的結果重新審視傳統的預測模型的準確性,同時我們還可以嘗試在自然的狀態下改變額外的變量去提高模型的準確性,這種設置還允許進一步分析如何以及為什麼新的技術和方法可能更好,以及在數學上有什麼改進的可能。

目前人工智能和數據科學的技術已經被廣泛地應用於臨床診斷、手術指導、風險預測等不同的領域。在某些領域,計算機診斷的準確率甚至比醫生還高,這是很大的進步,對臨床實踐影響深遠,正是這樣的成就進一步激發了科研人員的幹勁。未來醫學更大的變革,將會更依賴於數學理論的突破和人工智能技術的進步,這是毫無疑問的。

數學應用多姿多彩


數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


數學應用多姿多彩,每人有不同的志趣,走不同的方向,大致上可以分為如下幾類:

數據科學,張量,大數據,人工智能,機器學習;

數值優化,運籌學,以及在大規模機器學習中的應用;

量子計算,量子算法以及在機器學習中的應用;

數值線性代數,矩陣計算以及在數據科學中的應用;

大規模科學計算和高性能計算,如計算材料科學,計算量子化學,計算電磁學等的快速算法和並行算法等;

數值偏微分方程,有限元理論和方法,多重網格算法,(非)線性守恆律等;

多尺度模擬;

計算液體動力學,計算連續力學,如複雜流體,多孔介質滲流,界面問題,地球物理流,生物流體動力學

數值逼近論;

反問題的數值解法;

計算機圖形學,計算共形幾何,圖像處理,醫學影像處理等;

動力系統和混沌,非線性動力學,經典與量子(不)可積系統,耗散系統等;隨機分析,隨機微分方程,不確定性量化及應用,統計計算,蒙特卡洛方法等及其在機器學習中的應用;

數理經濟學,金融數學,精算保險等;

數學生命科學,包括生物統計,生物信息學,理論神經科學等;

博弈論;

控制理論;

數字信號(如地震波)處理,編碼學;

信息與通信科學;

密碼學。

基礎數學應用到不同的地方,各個不同領域是很多的,數據學、數值優化運籌學,大規模機器學習中的應用。量子計算機器學習的應用,數值線性代表、矩陣計算都是很重要的,大規模科學計算跟高性能計算都是很重要的,材料力學、量子化學種種都需要數學的發展。

這些不同的方向,期望國家都能夠花點功夫支持,這些方向都是未來整個高科技社會里面最重要的發展方向。未來10年裡,要想在北京能夠完成這些重要的學科發展,這需要很大規模的配套投資,期望我們能夠很快的追上這些學科的發展腳步!(圖片來源於網絡,由編輯所加)

注:該原始稿件已在《數理人文》雜誌發表,原標題為“數學和基本科學在應用科學中的重要性”。

數學有什麼用?丘成桐:AI和大數據的未來都得靠它!


分享到:


相關文章: