03.05 AMD將為El Capitan超級計算機提供cpu

去年秋天,由於Cray被惠普企業(Hewlett-Packard Enterprise)以1.6億的價格收購,該公司宣佈已由美國能源部選擇另外兩臺基於處理器的Cray Shasta體系結構的億億級超級計算機。勞倫斯·利弗莫爾國家實驗室(LLNL)的El Capitan超級計算機耗資約6億美元,計劃於2023年生產,基於下一代“熱那亞” AMD EPYC CPU,每個CPU均集成有四個AMD第三代的下一代AMD Radeon GPU。無限面料。儘管細節仍然很匱乏,但我相信集成的四GPU加CPU方法可能會對NVIDIA構成潛在挑戰,但請注意,要趕上NVIDIA在AI和HPC軟件方面的領先地位,AMD可能需要花費數年的時間。

AMD將為El Capitan超級計算機提供cpu

LLNL,Cray和AMD的發言人宣佈,他們將開始部署該系統的El Capitan性能,該性能將使用模擬和機器學習來保護美國的核儲備,並且將實現超過2 exaflops的速度,或比其快30%以上先前已公開。儘管該小組沒有透露Xen 3 CPU中的節點數或內核數,但他們確實指出了通過AMD的內存一致性Infinity結構互連的4對1 GPU / CPU架構,然後每個節點都通過Cray Slingshot互連互連。HPE Cray的首席技術官史蒂夫·斯科特(Steve Scott)說,預期每秒2,000,000,000,000,000,000百萬次操作的性能是當今排名第一的超級計算機(由IBM POWER CPU和NVIDIA GPU驅動的ORNL Summit)的性能的十倍,

AMD的Forrest Norrod表示,AMD EPYC和Radeon GPU將是標準產品,而不是為LLNL構建的特殊SKU。該團隊除了聲稱擁有業界領先的每核和多核性能外,還具有關鍵特性之一,就是編程簡單,而Infinity Fabric的共享內存一致性極大地提高了編程效率。這意味著在節點上運行的每個軟件線程都可以將GPU和CPU內存上的所有四個HBM-3堆棧作為單個內存空間進行訪問。我懷疑AMD固件將為HBM內存提供智能內存預取和管理。

首先,在這種對性能至關重要的系統中選擇AMD充分說明了該公司的CPU和GPU路線圖。這意味著DOE和Cray的工程師和管理層對AMD的未來和執行能力充滿信心。

從技術上講,將CPU和四個GPU結合在集成的緩存一致性結構上具有巨大的潛力,可以優化性能並最大程度地減少編程麻煩。與此形成鮮明對比的是NVIDIA,後者沒有數據中心級CPU,而是使用其專有的NVLINK V2來互連GPU,這取決於與CPU的PCIe Gen 3 I / O互連要慢得多。IBM POWER確實支持NVLINK 2,但是POWER每天的相關性較低。因此,除非NVIDIA開始大量投資於ARM服務器CPU或收購IBM POWER,否則我不知道他們是否會如我所願實現這一機遇。

這意味著,儘管AMD面臨著巨大的軟件挑戰,但在中等規模(4-GPU節點)規模上可能會具有優勢。我還要指出,由於包裝和緩存的一致性,AMD的方法僅限於四GPU架構,並且將依靠Cray Slingshot大規模互連更多GPU。但是Slingshot絕對不會懈怠,它在64個200 Gbps端口上以每個方向驚人的12.8 Tb / s的速度提供了極高的帶寬。雖然AI可以使用數千個GPU,但是四個GPU節點對於HPC來說是非常理想的,並且對於當今的DNN模型也可以很好地運行AI。

NVIDIA意識到即將到來的大規模面料爭奪戰,正在計劃收購Mellanox,可以想像這可以為大規模GPU面料提供解決方案。但是,當然,沒有CPU能夠自然地“說” Mellanox InfiniBand,並且仍不清楚NVIDIA如何解決CPU-GPU瓶頸。英特爾方面已經與Habana Labs接軌,後者使用100Gb以太網和RDMA來滿足相同的要求。以太網連接節點,而Infinity連接節點內的處理器。

最後,我要指出的是,AMD和NVIDIA(以及不久的將來)在構建AI專用ASIC的初創企業中都將享有優勢:GPU可以處理高性能計算中常見的64位浮點密集型工作負載以及精度較低的AI工作負載。這就是NVIDIA在公共雲中如此流行的原因之一。所有三臺位於美國的Exa級超級計算機都將使用GPU(來自Intel和AMD)來處理HPC的繁重工作,同時還為AI提供性能提升。一些人,例如正在試驗Cerebras的Argonne國家實驗室,將在靠近其主要HPC系統的地方添加專用AI芯片來補充這些計算。

通過將其CPU和GPU實力結合到一個集成產品中,AMD正在使其自己在HPC中的吸引力, AMD將完成其工作,以構建滲透AI市場所需的AI軟件生態系統,並且我們所有人都必須等待AMD,Intel和NVIDIA的下一代芯片,以確定AMD是否可以將其利用到領先市場中位置。



分享到:


相關文章: