16塊Tesla V100計算卡合體!NVIDIA造頂級計算平臺

NVIDIA的下一代GeForce遊戲卡遲遲不肯露面,一方面是缺乏充足的競爭刺激,另一方面則是NVIDIA的業務中心早已經轉移,不再只盯著遊戲卡,更關注的是計較平臺,現實了局那兒那裡成漫空間更大,利潤也高得多。

NVIDIA今天公佈揭曉推出新一代計較平臺“HGX-2”,擁有多達16塊頂級計較卡Tesla V100,並且第一次將AI人工智能、HPC高機能計較交融在了統一架構之內。

16塊Tesla V100計算卡合體!NVIDIA造頂級計算平臺

Tesla V100基於新一代GPU架構“Volta”(伏特),接納臺積電12nm FFN(16nm加強版)工藝製造,擁有5120個CUDA焦點、640個Tensor深度進修焦點,面積達815平方毫米,集成了210億個晶體管。

其浮點機能高達半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor機能則有120TFlops,同時搭配4096-bit位寬的16GB HBM2高帶寬顯存,頻率1.75GHz,帶寬900GB/s。

NVIDIA此前的計較平臺HGX-1整合了8塊Tesla V100,總計40960個CUDA焦點、5120個Tensor焦點、256GB顯存,經由過程300GB/s雙線帶寬的NVLink總線相連,浮點機能單精度125TFlops、雙精度62TFlops,Tensor機能1PFlops。

而新一代HGX-2則用上了16塊Tesla V100,規模和機能輕鬆翻番,總計81920個CUDA焦點、1024個Tensor焦點、512GB顯存,浮點機能單精度250TFlops、雙精度125TFlops,Tensor機能2PFlops。

NVIDIA還在體系內安排了12顆NVSwitches開關,用於GPU之間的直接互聯,NVLink總線雙向帶寬高達2.4TB/s。

16塊Tesla V100計算卡合體!NVIDIA造頂級計算平臺

除了高機能,HGX-2平臺的最大利益是支撐多種精度計較,可順應不合需求,比如在科學計較和模仿中,可使用FP64、FP32高精度計較,而在AI練習和推理中,則可使用FP16浮點、Int8整數精度計較。

聯想、超微、QCT、Wiwynn四大辦事器廠商都將在本年晚些時辰出售各自的HGX-2體系。

富士康、英業達、廣達、緯創四大ODM廠商則正在設計基於HGX-2的體系,將在本年晚些時辰面世,可用於雲計較數據中心。

16塊Tesla V100計算卡合體!NVIDIA造頂級計算平臺


分享到:


相關文章: