中國超算有望重回No.1!天河三號原型機國產系統+晶片曝光

我國超級計算機又有新突破!

據新華社消息,在國家超級計算天津中心,我國自主研發的新一代百億億次超級計算機——“天河三號”E級原型機完成研製部署,並順利通過分項驗收。

“天河三號”原型機,全面搭載國產自主芯片,不再使用英特爾處理器。而且相關的操作系統、並行開發等系統也為自主研發。

由此,中國E級計算機將很快進入實質性研發階段。

按計劃,“天河三號”超級計算機有望於2020年研製成功,其運算能力將比“天河一號”提高200倍,存儲容量提高100倍

今年6月,中國丟掉蟬聯多次的全球超算冠軍寶座,美國超算時隔多年重返榜首。而“天河三號”有望在兩年內,奪回這一殊榮。

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

天河三號E級原型機機櫃

自主突破

“天河三號”E級原型機,由國防科技大學和國家超級計算天津中心等團隊合作研發,並部署在國家超級計算天津中心。

2016年,科技部結合“十三五”發展規劃,分兩期啟動我國E級計算機研製計劃。第一期主要為E級計算機關鍵技術研究,安排了三個E級機原型樣機的研製;第二期為研製E級計算機。

其中,“天河三號E級原型機系統”經過兩年多的關鍵技術攻關和突破,成為我國首個完成原型樣機系統研製和部署的項目。

這次天河三號項目團隊完成了四項大事:

自主設計了三款芯片:“邁創”眾核處理器(Matrix-2000+)、互連接口芯片、路由器芯片;

設計了四類結點(計算結點、I/O服務結點、I/O存儲結點、服務結點)、十餘種PCB電路板;

設計和實現了新型的計算處理、高速互連、並行存儲、服務處理、監控診斷、基礎架構等硬件分系統,

以及系統操作、並行開發、應用支撐和綜合管理等軟件分系統

“這一切都是為了全面實現超算系統的自主可控。”中山大學數據科學與計算機學院教授、國家超級計算廣州中心主任盧宇彤表示,原型系統是主要驗證核心關鍵技術的可行性,包括CPU、互連通信、存儲架構、能效比等,並不追求峰值。所以,不和美國Summit系統比規模。

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

據科技日報報道,“天河”系列超級計算機,在核心關鍵技術上已實現了整體自主可控。

目前,通用CPU和加速器CPU、互連通信路由芯片和互連接口芯片,均已裝配在“天河二號”2期系統中,打破了2015年美國對國防科大和“天河”系超算中心的CPU禁運,而“天河三號”超級計算機將對這四大芯片進行全面升級。

這還不夠,未來“天河三號”E級超級計算機將對已經設計生產的三款計算、互聯通信核心芯片再進行全面升級。

同時基於飛騰CPU設計新的多核CPU,實現可支持海量數據存儲的層次式存儲系統,對適用高性能計算和高效大數據處理的柔性體系結構進一步優化,最終制造出新一代“天河三號”E級超級計算機。

美國Summit重回超算Top 500榜首,但真正的較量在於下一代百億億次超級計算

今年7月,美國的超級計算機Summit超過神威·太湖之光,在最新的全球超級計算機Top 500榜單中,重新奪回了第一名的位置。

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

超算Top 500榜單每年發佈兩次。2013年6月,中國的天河二號首次奪得冠軍,之後連續5次佔據第一名的位置,直到2016年11月,神威·太湖之光橫空出世,以理論峰值性能125 P奪得當年Top 500冠軍,天河二號位居第二,這樣的排名一直保持到2018年6月。

從美國人眼中看來,中國相當於連續5年霸佔了Top 500冠亞軍的位置。

幾年前,美國部署了3臺百P量級的超級計算機,分別是Summit、Sierra、Aurora,每秒運算速度可達100P到200P左右。除了保持美國超算科技領先,一個很大的原因,就是重新奪回Top 500第一的位置。

根據原定計劃,美國預計在2018年年底推出第一臺機器,以此重返Top 500榜首。

但美國終究還是無法容忍中國再繼續霸佔Top 500的冠軍位置,於是將計劃提前,在今年6月推出了Summit、Sierra兩臺機器。其中,Summit更是將峰值性能直接提升到200P,終於如願奪回世界第一的寶座,而Sierra也以125P的理論峰值超越天河二號,位居第三。

但是,正如此前中科院計算機研究所並行軟件實驗室主任、國家超算濟南中心主任張雲泉指出的那樣,這次美國雖然拿了第一,但Summit與中國的神威·太湖之光所釆用的體系架構相比,並沒有本質的區別。

張雲泉博士在文章裡寫道:“太湖之光的峰值是125P,美國的Summit是187P,沒有量級上的性能差別。只是說由於Summit的投資力度大、研發時間晚,採用了新的工藝和技術,它的峰值比太湖之光高一些,但是其在架構和技術上並沒有拉開差距。”

在張雲泉和更多超算專家看來,真正的競爭,在於新一代百億億次(E級)計算機的研發

如今,超算已經成為一個國家信息技術創新的核心驅動力量,是綜合國力提升的強大支撐。新一代E級超級計算機的研製是國際上高端信息技術創新和競爭的前沿領域,美國、日本和歐盟均已提出E級超級計算機的研製計劃,幾乎都是在2021年左右完成。

我國的E級超級計算機的研製計劃也早已提上日程。科技部原定計劃是2020年推出中國的E級計算機,但由於技術限制和一些拖延,有可能會延後到2021年。

全球各國又重新開始重視超算,新一代E級計算的競爭賽點,就是2021年!

決戰2021:中國分三條路探索E級計算機

2016年,國家科技部結合“十三五”發展規劃,通過國家重點研發計劃支持,開始分兩期啟動我國E級計算機研製計劃。第一期主要為“E級計算機關鍵技術”研究,安排了三個E級機原型樣機的研製,第二期則為研製E級計算機。

這三個E級原型機分別是天河三號E級原型機、神威E級原型機和曙光E級原型機

實際上,今年8月初,神威E級原型機也將在國家超算濟南中心落地,調試完畢後正式進入試運行階段。神威E級計算機原型由中國國家並行計算機工程技術研究中心研製,造價6000萬元,採用水冷技術,運行速度也在規定範圍內的3~5P。

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

神威E級原型機正在超算濟南中心安裝

目前,神威E級計算機原型正在濟南中心進行組裝,預計8月初調試並課題驗收完成,之後將正式進入試運行。曙光E級原型機也將於近期完成項目驗收。

預計在今年8~9月,所有三臺原型機都將完成最終驗收。

目前,這三個E級原型機分佈部署在中國六大超算中心:一是天河系列,部署在長沙、廣州和天津三個中心;二是神威系列,部署在無錫和濟南兩地;三是曙光系列,部署在上海和深圳中心。

張雲泉表示,從現在的趨勢來看,未來中國三臺E級超級計算機都會採用眾核加速的體系結構,所不同的只是眾核的架構,一種是異構眾核,一種是主從眾核,還有一種是多核處理器和眾核加速器完全分離的柔性異構眾核。

實際上,現在由於超算競爭異常激烈,很難從普通報道中得知有關E級原型機的規格指標。

不過,中國頂級的超級計算機研究人員、同時在中山大學和北航擔任教授的錢德沛博士,在2017年11月舉行的SC大會上做了報告《中國在百億億超級計算方面的努力:現狀與前景》(China’s Effort on Exascale Computing: Current Status andPerspectives),其中提到了中國三臺E級原型機的一些細節:

曙光E級原型機:

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

天河E級原型機:

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

天河E級原型機技術路線

天河E級原型機的技術指標是:

靈活的架構可以滿足不同的應用:

新一代多核處理器,追求平衡計算和內存訪問

光電集成高速互連,大大提高了性能和能效

基於新存儲介質的容錯能力

精確散熱,在製造成本與運營成本之間進行權衡

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

天河E級原型機內部連接

神威E級原型機:

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

神威E級計算機原型硬件系統

中國超算有望重回No.1!天河三號原型機國產系統+芯片曝光

神威E級原型機計算節點

按照天河的技術路線,未來的E級系統將採用自主的飛騰處理器、Matrix-3000加速器、新一代高速互聯通信、麒麟操作系統等一系列自主創新技術。

神威E級系統則預計將重點放在國家海洋實驗室的八大領域,提供海洋領域超算服務,包括海洋大數據、海洋氣象預報、海洋地質研究、海洋藥物、海洋安全、海洋食品等多個國家級任務。

曙光E級系統原型系統採用浸沒式相變冷卻方式,通過把計算部件浸沒在液體中,通過液體氣化蒸發帶走部件工作產生的熱量,PUE可以達到業內最低。

來源:新智元(ID:AI_era)、量子位(ID: QbitAI)


分享到:


相關文章: