如何為深度學習選擇 GPU 服務器?

現今,日益完善的深度學習技術和-AI-服務愈加受到市場青睞。與此同時,數據集不斷擴大,計算模型和網絡也變得越來越複雜,這對於硬件設備也提出了更為嚴苛的需求。如何利用有限的預算,最大限度升級系統整體的計算性能和數據傳輸能力成為了最為重要的問題。

如何為深度學習選擇 GPU 服務器?

GPU-的選擇

熟悉深度學習的人都知道,深度學習是需要訓練的,所謂的訓練就是在成千上萬個變量中尋找最佳值的計算。這需要通過不斷的嘗試識別,而最終獲得的數值並非是人工確定的數字,而是一種常態的公式。通過這種像素級的學習,不斷總結規律,計算機就可以實現像人一樣思考。因而,更擅長並行計算和高帶寬的-GPU,則成了大家關注的重點。

GPU-一個比較重要的優勢就是他的內存結構。首先是共享內存。在-NVIDIA-披露的性能參數中,每個流處理器集群末端設有共享內存。相比於-CPU-每次操作數據都要返回內存再進行調用,GPU-線程之間的數據通訊不需要訪問全局內存,而在共享內存中就可以直接訪問。這種設置的帶來最大的好處就是線程間通訊速度的提高(速度:共享內存>>全局內存)。

如何為深度學習選擇 GPU 服務器?

而在傳統的CPU構架中,儘管有高速緩存(Cache)的存在,但是由於其容量較小,大量的數據只能存放在內存(RAM)中。進行數據處理時,數據要從內存中讀取然後在-CPU-中運算最後返回內存中。由於構架的原因,二者之間的通信帶寬通常在-60GB/s-左右徘徊。與之相比,大顯存帶寬的-GPU-具有更大的數據吞吐量。在大規模深度神經網絡的訓練中,必然帶來更大的優勢。

另一方面,如果要充分利用-GPU-資源處理海量數據,需要不斷向-GPU-注入大量數據。目前,PCIe-的數據傳輸速度還無法跟上這一速度,如果想避免此類“交通擁堵”,提高數據傳輸速度可以選擇應用-NVlink-技術的--GPU-卡片。

NVLink-是目前最快的-GPU-高速互聯技術,藉助這種技術,GPU-和-CPU-彼此之間的數據交換速度要比使用PCIe 時快-5-到-12-倍,應用程序的運行速度可加快兩倍。通過-NVLink 連接兩個-GPU-可使其通信速度提高至-80-GB/s,比之前快了-5-倍。

其中-Nvidia-的-Volta-架構計算卡使用的-NVLink-2.0-技術速度更快(20-25Gbps),單通道可提供-50-GB/S-的顯存帶寬。

如何為深度學習選擇 GPU 服務器?

而且就目前而言,越來越多的深度學習標準庫支持基於-GPU-的深度學習加速,通俗點描述就是深度學習的編程框架會自動根據-GPU-所具有的線程/Core-數,去自動分配數據的處理策略,從而達到優化深度學習的時間。而這些軟件上的全面支持也是其它計算結構所欠缺的。

簡單來看,選擇-GPU-有四個重要參數:浮點運算能力、顯存、數據傳輸與價格。

對於很多科學計算而言,服務器性能主要決定於-GPU-的浮點運算能力。特別是對深度學習任務來說,單精浮點運算以及更低的半精浮點運算性能則更為重要。如果資金充足的情況下,可以選擇應用-NVLink-技術單精計算性能高、顯存大的-GPU-卡片。如果資金有限的話,則要仔細考量核心需求,選擇性價比更高的-GPU-卡片。

如何為深度學習選擇 GPU 服務器?

內存大小的選擇

心理學家告訴我們,專注力這種資源會隨著時間的推移而逐漸耗盡。內存就是為數不多的,讓你保存注意力資源,以解決更困難編程問題的硬件之一。與其在內存瓶頸上兜轉,浪費時間,不如把注意力放在更加緊迫的問題上。如果你有更多的內存,有了這一前提條件,你可以避免那些瓶頸,節約時間,在更緊迫問題上投入更多的生產力。

所以,如果資金充足而且需要做很多預處理工作,應該選擇至少和-GPU-內存大小相同的內存。雖然更小的內存也可以運行,但是這樣就需要一步步轉移數據,整體效率上則大打則扣。總的來說內存越大,工作起來越舒服。

中科雲達R4220-8GX

如何為深度學習選擇 GPU 服務器?

強大的性能

R4220-8GX 是一款基於Intel® Xeon® 可擴展處理器的高性能計算平臺,支持8個NVLINK GPU加速器和6TB的內存,單精度浮點計算224TFLOPS、雙精度浮點計算112TFLOPS, 讓用戶體驗強大的計算性能。

靈活的配置

為更加貼切的滿足各種應用需求,客戶可根據需求選擇支持16個2.5寸SATA/SAS硬盤,網絡選擇多樣化,可選擇支持雙千兆、四千兆、雙千兆+雙萬兆搭配,所有網絡支持管理複用,滿足各種不同的網絡應用場景。

優化的散熱

整機結構佈局充分考慮優化散熱和節約功耗,支持高溫環境。關鍵部件根據發熱量採用特殊設計,在保持性能的同時可以降低風扇轉速,從而減低功耗和噪音。

合理的擴展

在支持4-8塊NVLINK的同時,還可有1個PCI-E插槽可用,可擴展100Gb infiniband HCA、Nvme SSD等、具有非常好的靈活性和兼容性。

便捷的管理

具備IPMI 遠程管理功能,實現非現場即可監控管理服務器要求,具有監控系統各部件的運行狀況、遠程安裝操作系統、故障報警等功能。極大的縮減了維護開銷。


分享到:


相關文章: