向全球快速擴散的中國超算,讓中國速度有了新的聯想

向全球快速擴散的中國超算,讓中國速度有了新的聯想

美國著名高性能計算專家、美國印第安納大學計算機教授、美國橡樹嶺(Oak Ridge)國家實驗室訪問學者Thomas Sterling在2018年6月23日接受美國媒體採訪時表示,近期中國在全球高性能計算市場取得主導地位這一現象非常值得關注。他表示,中國已經展現了顯著的創新能力,已經部署的高性能計算系統也很具有競爭力。此外,中國正在快速學會如何把這些超級計算機系統應用到現實世界中,解決實際的問題。

2018年6月25日,在2018年國際超級計算機大會(ISC)大會上公佈了新一屆全球高性能計算TOP 500(也稱:超算TOP 500)榜單。儘管一度蟬聯了TOP 500榜首的中國“神威·太湖之光”在今年讓位給了美國橡樹嶺國家實驗室的超級計算機SUMMIT,但中國的超算系統規模已經成功擴大到了全球。今年,聯想以117套的份額成為首家在該榜單中問鼎全球第一的中國廠商,這也意味著聯想成為了全球最大的TOP 500超算平臺提供商。

實際上,去年聯想曾設定目標到2020年成為TOP500超算系統提供商,現在提前兩年實現了這一目標。TOP 500超算系統中約每四套系統中就有一套來自聯想,這意味著中國正在成為全球創新的主力技術供應商。

中美爭霸全球技術制高點

世界超級計算機TOP 500榜單,每年發佈兩次排名,每年6月份在德國召開一次全球超級計算大會併發布一次排名,11月份在美國開一次全球超級計算大會併發布一次排名。

在最新發布的2018年6月TOP 500榜單中,來自中國技術廠商提供的500強超級計算機系統達到了206套、美國降到了124套;而在2017年11月的榜單中,來自中國技術廠商的數量由6個月前的160套升至202套、美國則由169套降至143套。而在2018年6月TOP 500榜單的中國席位中,聯想提供了117套,佔據首位。

向全球快速擴散的中國超算,讓中國速度有了新的聯想

(上圖為聯想首席科學家祝明發)

聯想首席科學家祝明發表示,全球超算TOP 500榜單目前主要是中美國兩強競爭,體現在榜首的競爭、市場份額的競爭和應用的競爭。在這三者中,市場份額又佔有很重要的地位,標誌著整體水平。2018年6月的榜單,除了中美兩強外,日本達到了36套、英國22套、德國21套。這意味著中國在全球超算應用和市場份額佔比越來越多,美國份額相對在縮小,而歐洲和日本的份額縮小更快。

全球超算TOP 500的整體趨勢是中國廠商越來越強,變成了中美共同佔據TOP 500的絕大部分。而中國廠商從一開始的邊緣者變成了領導者,並且這個趨勢一直在強化,而並不是在2018年突然變強了。聯想數據中心業務集團中國區企業級營銷產品營銷總監李煒表示,TOP 500榜單背後是高性能計算對國家經濟實力和基礎設施應用以及創新等方面的折射。中美在科技的重視度和高性能計算上的壟斷,正逐步拉開與歐洲和日本的差距,中國在趕超美國的趨勢也越來越明顯。

聯想超算再創造中國速度

在全球超算TOP500歷年的榜單上,中美兩國在1993年時存在不小差距,而這個差距在2016年6月迅速縮小。在2016年6月的全球超級計算機500強榜單中,來自中國的聯想集團在500個席位中奪得了92個席位,成為在超算、高性能計算領域排名全球第二的廠商。此後至今兩年,聯想連續四屆獲得TOP500中國第一、全球第二,再定義了“中國速度”。

向全球快速擴散的中國超算,讓中國速度有了新的聯想

(上圖為聯想數據中心業務集團中國區企業級營銷產品營銷總監李煒)

2001年4月,在祝明發的帶領下,聯想成立了高性能服務器事業部,相繼研發出中國第一個萬億次、四萬億次、十萬億次、百萬億次的超算集群,從深騰系列到GPU+CPU異構架構HPC,再到LiCO智能超算平臺和溫水水冷技術,聯想一直在高性能計算領域持續投入。聯想在2002年7月成功研製世界上第一個實際速度超過1萬億次的大規模機群系統深騰1800;2008年研製成功深騰7000,是當時世界上最先進的機群服務器之一;2009年研製了GPU+CPU異構架構的HPC,計算能力超過兩百萬億次;2014年收購IBM X86後再上臺階。

以聯想HPC和工作站P系列為代表的聯想企業級產品,服務於中國載人航天工程實驗室和主要研製單位,在軌道計算、模擬仿真、航天器設計等關鍵事件中,承擔了大量重要的計算工作,為載人航天工程總體頂層決策提供了有力技術支撐。2016年11月,神州十一號返回艙送出,結束連續33天在軌運行,比神州十號提高了一倍多。神十一載人航天工程任務,飛船飛行高度393公里,比神舟十號提高了50公里,軌道計算尤為重要。聯想為中國載人航天工程總體仿真實驗室,提供了一套以聯想HPC和工作站為核心的仿真系統,使實驗室擁有了可靠的計算能力,為飛船和軌道的各種不同狀態進行精確計算。事實證明,聯想提供的計算能力,做到了毫釐不差。

在2018年6月的全球超算大會上,聯想發佈了第三代水冷服務器,聯想內部代號叫“海王星”。第三代水冷服務器的出現,是因為服務器計算力越來越強,例如現在一臺服務器相當於過去40個機櫃的計算能力。那麼,如何讓一臺服務器具備越來越強的計算力,散熱是一個重大的問題。

聯想溫水水冷技術,利用純淨水作為冷媒,採用間接式液冷方式對計算機服務器進行冷卻,對CPU、GPU等採用微通道散熱器,針對內存、較低功耗的I/O板卡等部件採用導熱板散熱技術,採用45攝氏度的溫水作為IT設備製冷的冷媒工質,在大多數地區可以獲得PUE<1.1的效果。而聯想第三代水冷服務器,把水溫從上一代的45度提高到50度,散熱的效率從上一代的85%提高到了90%以上。

李煒介紹,50度水溫的好處包括:第一,代表著機箱的最高溫度不可能超過50度;第二,可以實現英特爾至強CPU的超頻,相當於送給了客戶25%以上的計算能力,同時實現30%到40%的能源節省;第三,PUE(極限值為1)進一步到達1.1以下,而風冷情況下最好可以達到1.5到2.0之間。德國萊布尼茨數據中心採用了16700臺聯想水冷服務器,每年可以節省1000萬歐元以上的電費;北京大學也採用了聯想水冷服務器,每年可以節省100萬度電。

聯想數據中心業務集團中國區教育行業總監蔡斯揚表示,即便是現在技術非常領先的BAT互聯網用戶,服務器的負載也不超過70%,但在高性能計算的場景下需要把一臺機器的計算能力壓榨極限。聯想為北京大學提供的水冷超算機型,最後釋放出來的計算力達到了92.7%,這其實是整個系統設計和平臺調優以及多年技術積累的結果。

除水冷外,聯想為北大交付的冷凍電鏡超算項目,除了傳統的節點外還有8個GPU的加速節點,同時在冷凍電鏡第二期超算項目裡交付了12個PB的超大容量存儲,這套存儲的性能達到了100GB/S以上,是同等I/O帶寬速度最好的。為什麼要用這麼高I/O的帶寬性能?因為在研究細胞核基因結構的時候,顯微鏡要不斷地拍照片、每一秒都要拍照,通過高效算法把三維的物體拍照成二維的照片,再通過算法把照片還原為三維的結構,這就需要大存儲、高帶寬,可以來回地讀寫和傳輸大容量圖片。

正是在這些多年技術積累的基礎上,聯想超算才能再創造“中國速度”。

以用戶成功為標誌

祝明發是聯想集團首席科學家,也是北京航空航天大學教授、博士師導師、計算機系統結構研究所所長。他表示,做高性能計算需要用戶取得成功才算是真正的成功。這麼多年來,聯想高性能計算一直堅持這條,即用戶應用聯想超級計算機系統取得了成果,才是成功的標誌。

向全球快速擴散的中國超算,讓中國速度有了新的聯想

(上圖為聯想數據中心業務集團中國區教育行業總監蔡斯揚)

為了讓客戶應用超算成功,聯想超級計算機提供的是一站式交付。李煒提供了更鮮活的說明:聯想交付的高性能集群相當於“精裝房”,讓客戶的應用可以直接“拎包入住”。以北大這樣一箇中等規模的高性能集群為例,採用了服務器、存儲、系統軟件,再經過測試調優,傳統方法部署需要一到兩個月時間,而如果需要機房擴容、增加電力等就需要三個月時間。而聯想服務器在工廠生產製造的時候,就已經把用戶提供的各種軟件和應用全部調試好,到了現場直接模塊化裝配。一套800臺機器的超算系統,其它廠商採用傳統方式需要半年的時間,而聯想可以在一到兩個月內就成功交付。

實際上,超算項目的交付就是跟時間賽跑。一套超算系統,小規模的為幾百萬元,大規模的上千萬甚至過億元,但一套超算系統真正的生命週期可能也就3到5年。而如果市場佈局和端到端的能力達不到,一套超算系統的交付的週期將會是一年甚至是更長。而對用戶來說,晚交付一天就意味著幾萬到幾十萬的損失。而聯想超算系統的模塊化交付,可大幅減少系統部署和上線的時間。

目前,全球排名前25位的研究型大學和機構中,有17家正採用聯想的HPC和AI解決方案進行研究。聯想超算還支持著全球160多個國家眾多領域的突破性研究,包括癌症、大腦研究、天體物理學、人工智能、氣候科學、化學、生物學、汽車和航空等等。這些用戶最終採用了聯想的高性能計算解決方案,一站式交付起到了重要作用。

據蔡斯揚介紹,聯想在亞洲市場也獲得了高度認可。特別是最近聯想將打破由自己保持的亞洲高校最快高性能計算的記錄,之前是日本東京大學,後來是2016年聯想交付的南京大學超算集群,當時也是亞洲高校最大規模集群,而今年聯想要交付的南方科技大學超算集群將打破聯想以前保持的記錄。南京大學超算集群也幫助很多海外學者進行研究,因為很多學者在海外做科研缺乏超算環境,例如蔡斯揚認識的一位南京大學女學者,以前在美國做大氣湍流研究但缺乏相應的超算機器,來到南京大學後用超算機器把湍流計算的精度從過去的100米現在縮小到了5米,預測的精準度和偏差從原來幾百公里甚至是上千公里縮小到現在的十幾公里精度,實現了質的飛躍。

當然,聯想能在全球超算TOP 500榜單中佔據117套,產品質量也是重要原因。祝明發認為,高性能計算機到最後不外乎拼質量和應用等幾個因素。在質量方面,聯想在高性能計算機領域進行了大量投入,包括位於北京聯想總部的高溫實驗室、震動實驗室、跌落實驗室等。此外,聯想還在美國莫里斯維爾、德國斯圖加特以及中國北京擁有三大AI創新中心,幫助企業打造符合AI發展趨勢和智能業務發展需求的高性能計算基礎設施和業務場景。而在應用方面,伴隨聯想Open+開放架構戰略的延伸,聯想與不同領域的廠商合作,為高性能計算在氣象、製造、能源等行業提供了應用之地。

國家超級計算無錫中心主任楊廣文就美國超級計算機SUMMIT與中國的神威·太湖之光對比認為,這二者仍屬於一個速度量級,中美超算之爭並沒有產生有“質”的變化。而接下來更重要的是對於超算的應用,中國在這方面還存在短板。為讓更多的中國企業,開發出更多適合超級計算機的應用,讓中國超算的技術能力擴散到國民經濟中,將是中國速度的“新聯想”。(文/寧川)


分享到:


相關文章: