美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破

日前,美國能源部田納西州橡樹嶺國家實驗室的工程師推出了一臺名為 Summit 的超級計算機,這款超算的計算能力已經超過了中國神威·太湖之光超級計算機,比神威·太湖之光要快 60%。對於這件事,國人應該辯證的看,既要看到美國在超算方面具備非常深厚的技術積累;同時,也不要妄自菲薄,不要因中美兩國錯開了發展週期導致的交替領先而自嘆自哀。畢竟,在超算領域,中國完全可以拿出高度國產化,且性能與美國頂尖超算比肩的大機器。

美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破

對美國新超算要辯證的看

根據介紹,美國Summit 的峰值計算能力可以達到每秒 20 億億次,是美國此前的明星超級計算機Titan計算能力的 8 倍,比神威·太湖之光要快 60%。

Summit 超算性能如此強勁,主要得益於IBM的Power9、英偉達的 V100 GPU。Summit 超算搭載了9000多片Power9和大約28000片左右的V100 GPU。Power9是IBM研發的新一代CPU,擁有80億個晶體管,集成了22個CPU核。

值得一提的是,Power9還支持NVLink,由於NVLink相對於PCIE有很大的優勢,這使得IBM和英偉達的超算方案相對於英特爾的超算方案具備一定優勢。根據媒體介紹,通過NVLink,CPU和GPU之間的互聯帶寬,可以達到X86服務器所使用的PCIE3.0的9倍。

NVLink和bluelink有點類似,可以用來鏈接加速器、存儲設備等。Power9上的bluelink是可以通用的,支持NVlink只是功能之一。只不過,由於英偉達的GPU只支持NVlink,這使得IBM的Power8和Power9等極少數的幾款CPU成為了唯一支持NVlink的芯片。

雖然有媒體把IBM的這一做法稱為"展示了IBM重返超算芯片的決心",但實際上,NVlink也就只有英偉達自己玩。IBM可能是"順便"支持一下,畢竟IBM本質上是想支持相對開放的OpenCAPI。

這裡說明一下,既然NVlink這麼好,英特爾為啥不支持呢?

主要是因為商業競爭因素,畢竟英偉達和英特爾在HPC和機器學習市場競爭非常激烈,換作你要是英特爾的主管,你會去支持麼?

其實,不止NVlink英特爾不支持,像OpenCAPI、CCIX、GEN-Z 等開放的標準英特爾都沒支持。

不過,在感嘆Power9、V100和NVLink強悍性能的同時,我們也要看到Summit 超算的創新也是有一定侷限性的。

總的來說,Summit 超算的設計思路和天河2A沒有太多差別。具體來說,Summit 超算中的Power9其實就扮演著天河2A中E5的角色,而V100 GPU則發揮著天河2A中矩陣2000的作用。無外乎退出的時間遲了一點,CPU、加速器和互聯都新了一點,性能好了一點。

美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破

神威太湖之光超算上就沒有采用天河一號和天河二號上的方案,而是獨闢蹊徑,開創了片上微異構的設計。相比之下,美國Summit 超算則延續了前人探索出來的老路,相對保守一些。

另外,在性能功耗比上,有媒體用Summit 超算功耗與神威太湖之光相當,但性能比神威強60%來顯示神威超算的不足。其實,這主要是芯片製造工藝造成的,畢竟SW26010是2014年的芯片,採用相對老舊的28nm工藝。如果換成Power9、V100的先進工藝,神威超算的性能功耗比未必會比Summit 超算差。

美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破

高性能超級計算機意義重大

自天河二號在TOP500榜單上以絕對優勢佔據第一的寶座之後,各種攻擊紛至沓來。比如有媒體聲稱,把智能手機芯片連起來,可以輕易做出遠遠強於天河二號的超算;又比如因使用了美國的芯片,有媒體攻擊天河二號是"組裝貨"。在神威太湖之光實現芯片、互聯等核心技術全部國產化之後,超算無用論甚囂塵上。一些人聲稱,"因為現有的超算性能夠用,所以美國不需要比拼超算",中國搞超算是"政績工程"、"形象工程"。

非常有意思的是,當如今美國超算重回世界第一寶座之際,超算在一些媒體口中,又一下子從"政績工程"、"形象工程"變成了高端製造業的明珠。這種精神分裂的表現著實令人啼笑皆非。

其實,西方很多國家其實非常渴望像神威太湖之光這樣的高性能超算,因為很多應用在舊的超算上已經跑不動了。所以神威超算一問世,很多國外學者就很迫切地把自己的代碼、軟件拿過來和中國人一起研製,特別是在不涉軍涉密的科學研究上。

中國計算機學會高性能計算專業委員會秘書長張雲泉曾表示:"許多國外的朋友通過郵件找到我,說他們有個應用,希望和太湖之光聯合開展研究。還有法國大使館的科技參贊也專門找到我,希望中法之間簽訂戰略合作協議,讓法國的科學家到中國來使用太湖之光。"

美國 Summit 的超級計算機也證明了,世界各國對於超算性能的追求都是無止境的。原因在於超算的性能是永遠不夠用的,學科需求、計算的精度和規模是無止境地向前發展,我們現在超算的性能是無法滿足使用的。往往是超算應用降低精度要求、規模要求來配套現在超算的性能。

超算的重要性還體現在航天、國防、科研等諸多領域,比如國家計算流體力學實驗室基於"神威·太湖之光"超級計算機,對"天宮一號"飛行器兩艙簡化外形隕落飛行繞流狀態大規模並行模擬。國內某超算就承擔著模擬核爆、情報分析等非常關鍵的任務。

正是因此,在數年前,美國上一任總統奧巴馬就發過總統令,要求把世界第一超算的寶座搶回去。特朗普上臺後,雖然砍了很多科研經費和醫療方面的錢,但他沒砍超算的錢,反而給超算增加錢。這足以說明超算的重要性和意義。

結語

目前,中國和美國都在爭風奪秒研發E級超算。中國三家單位分別在研發各自的E級超算原型機。

美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破

在上個月,相關單位公佈了天河三號超算原型機。根據官方報道,天河三號將告別前代的英特爾芯片,那麼原型機裡的CPU極有可能是FT2000plus,而加速器則極有可能是矩陣2000,或者是矩陣2000更換更好工藝的升級版。

天河三號原型機的單個計算節點性能為6T,必須說明的是,這個只是原型機,6T的單節點性能只是原型機的性能,並不一定是天河三號的單節點性能,因為天河三號很有可能會更換性能更好的芯片。

總的來說,中美超算競賽將會進入交替領先的狀態,我們由衷的希望神威、天河、曙光超算能夠在E級超算的競賽中取勝!

美國超算重回世界第一 媒體所謂美國不需要高性能超算不攻自破


分享到:


相關文章: