美國“超算”反超“神威·太湖之光”,但中國不必太糾結

美国“超算”反超“神威·太湖之光”,但中国不必太纠结

美國能源部下屬橡樹嶺國家實驗室日前宣佈,造出一臺名為“頂點”(Summit)的超級計算機,其浮點運算速度峰值可達每秒20億億次,比中國的超級計算機“神威·太湖之光”要快60%,成為世界上最快的計算機。這是美國自2012年以來首次在運算速度上躍居第一位,此前的5年,世界最快計算機的寶座被中國連續保持。

“頂點”是意料之中?

“‘頂點’實現浮點運算速度峰值最快,並不是意料之外的事情。”張雲泉表示,幾年前,美國發布加速超級計算機研發的“珊瑚計劃”,佈局三大國家實驗室分別研發超級計算機系統。當時的計劃是在2018年,研製出運算能力達到百PFlops的三臺超級計算機系統Summit、Sierra、Aurora。其中Summit由IBM研製部署在美國能源部橡樹嶺國家實驗室,Sierra超級計算機將安裝在勞倫斯利弗莫爾國家實驗室,Aurora由克雷和英特爾聯合研發部署在阿爾貢國家實驗室。同時計劃到2021年前後推出100億億次超級計算機系統。所以這次“頂點”浮點運算速度峰值達每秒20億億次,只是比原計劃提前了半年左右實現。不過從全球超級計算機500強排行榜來看,看重的不僅僅是浮點運算的峰值,更重要是LinPACK值。

全球超級計算機500強排行榜每年6月和11月各公佈一次。6月下旬將公佈今年的第一次榜單排行情況,根據張雲泉的預測,這次全球超級計算機的前三名排名可能是第一名為美國的“頂點”,第二名是中國的“神威·太湖之光”,第三名是中國的“天河二號”,從計算性能上看,這次“天河二號”也完成了它的升級換代,峰值達到100PFlops。

張雲泉同時表示,超級計算機是國之重器,是一個國家創新能力乃至綜合國力的象徵,奪冠、擁有世界上跑得最快的計算機,能夠在科研以及重大項目的研發上比別人更快、更早發現一些東西,擁有一定的話語權,全球超級計算機500強排行榜只是它的附帶價值,並沒有大家想象的那麼重要。事實上全球在超級計算機排名座次基本上是交替輪換的格局,而且通常可預期,因為每一代超級計算機的問世都是需要經過幾年的研發,進行提前佈局。美國曾長期壟斷該榜單榜首位置。2010年,中國“天河一號”首次在該榜單登頂,但半年後即被日本的“京”拉下馬。不過,“京”也只支撐了一年,榜首位置又被美國奪了回去,並一直保持到2013年。其後是中國的“神威·太湖之光”保持了幾年,今年是美國的“頂點”。

“頂點”透露什麼趨勢?

從介紹來看,Summit其5600平方英尺的機櫃空間大約相當於2個網球場,Summit的重量大約相當於一架商用噴氣式飛機。Summit在高精度科學仿真方面可達到200 PFlops的性能,美國國家能源局橡樹嶺國家實驗室已經給它定下來要做的事情,助力科學家在高能物理、材料發現、醫療保健等領域的研究探索。其中在癌症研究方面將用於名為“CANcer分佈式學習環境(CANDLE)”的項目,其目標是開發能夠自動提取、分析和整理現有健康數據的工具,以揭示致病因素(如基因、生物標記物和環境)之間一直以來不為人知的關係。在聚變能源方面,將用來模擬聚變反應堆及其磁約束等離子體,加速商業開發。在疾病和成癮方面,研究人員將使用AI來識別人類蛋白質和細胞系統的功能和進化模式。這些模式能幫助人類更好地瞭解阿爾茨海默病、心臟病或成癮,進而助力藥物發現。

從計算的體系架構來看,它是CPU+GPU的典型架構,CPU採用IBM的Power9,GPU採用英偉達Volta GPU,以及英偉達的高速互聯技術NVLink。其中使用了4608個計算服務器,每個計算服務器中又含有兩個IBM生產的22核Power9處理器和6個英偉達公司生產的Tesla V100圖形處理單元加速器。

張雲泉介紹,目前全球的超級計算機發展主要面臨三大挑戰。一是億級並行可擴展的並行牆挑戰,如何為百億億次超級計算機設計可擴展的並行算法和軟件是一個巨大的挑戰。二是功耗牆,如何在三十兆瓦功耗的限制下,實現百億億次的計算速度。三是可靠性牆的挑戰。百億億次超級計算機有上億的併發計算部件,不允許任何一個部件出錯,一旦出錯,就會牽一髮而動全身,引起停機、算法錯誤等故障。

全球超級計算的下一個里程碑是100億億次的超級計算機,究竟誰能夠最先做出來,是中國還是美國或是日本或者歐洲?備受關注。從張雲泉的判斷來看,目前主要的競爭對手是中國和美國,目前中美兩國都對100億億次超級計算機的研發做了佈局,都預計是在2021年左右實現。

中國應該如何推動?

張雲泉表示,從超級計算的綜合競爭力來看,是美國強於中國,中國之所以這幾年連續保持領先,一方面是我們確實整個產業都在不斷努力,另一方面,中國在超級計算領域沒有太多的歷史包袱,無須考慮兼容原來的應用等,輕裝上陣。而美國事實上不僅僅是在硬件計算能力強,他們在應用與軟件編程等方面也非常強,而且處於兼容原來資產的考慮,他們在設計上需要考慮的維度比中國的要多。

中國超級計算在並行軟件研發與應用產業化上遠遠落後於美國。這次美國的“頂點”在研發的同時,主要為哪些應用提供服務與計算目標任務已經非常明確,是研以致用。中國對於超級計算的推動,應該“軟件”和“硬件”兩手都得硬,才能夠讓超級計算更好地服務於國家的重大科研工程,服務於國民經濟的發展。對於超級計算的硬件與軟件的發展國家至少要拿出1:1相同的資源投入,才有可能加速中國超級計算軟件與應用的發展,才能夠讓超計算“硬實力”有更大的用武之地。張雲泉表示,國家應該成立十幾個行業並行軟件國家工程中心,來進行軟件應用開發,另外還應在大學開設相應的課程,加速這個領域的人才培養。“中國超級計算發展的路線,應該由原來的機器拉動,改為軟件拉動。”張雲泉說。

關於超級計算機的國產芯片是國人普遍關心的問題。張雲泉表示,2015年美國對中國超級計算機實施芯片禁運,所以加速了中國的高端芯片的研發,讓中國在超級計算機的芯片供應上沒有後顧之憂。目前“神威·太湖之光”與天河二號分別採用國產的“神威”芯片和“飛騰”芯片,其中飛騰芯片是基於ARM架構。曙光公司的E級機計劃採用海光處理器,購買自AMD,是X86處理器。

對於超級計算與雲計算的不同定位,張雲泉認為,雲計算服務的是大眾市場,而超級計算服務於大科學工程、宇宙探索以及大的AI項目,他們之間是互補的,並不衝突,現在超級計算與雲計算也出現了一些交叉融合的趨勢。

美国“超算”反超“神威·太湖之光”,但中国不必太纠结


分享到:


相關文章: