補課——關於AMD服務器

7nm、64核心,這些高光亮點為AMD第二代EPYC帶來了極高的市場關注度,而長久處於Intel統御之下的服務器市場也迫切得需要競爭的再次引入。在雙重期待的加持下,AMD及其第二代EPYC處理器一時間風光無兩。

但除了這些最核心的閃光點之外,AMD第二代EPYC在架構及特性上還有更多值得關注的特性。而這些特性在服務器及數據中心應用中同樣有重大價值。

Chiplets設計帶來的多重靈活性

在第二代EPYC的設計中,Chiplets架構絕對是一大亮點。在代表了處理器先進設計思路、降低處理器設計難度和提高良率的同時,Chiplets也能夠為處理器帶來更多靈活性。

補課——關於AMD服務器

第二代EPYC平臺的IO Die

首先,作為一家Fabless工廠,第二代EPYC中並非所有組件的設計都來自於AMD自己。實際上,這一代產品中,AMD就將自己設計的核心架構、內部總線與合作伙伴的PCI-E 4.0控制器IP結合在了一起。

由於不同半導體IP與工藝製程有著相當強的綁定關係,而要將TSMC的7nm工藝應用在這一IP上還需要更多的調試、優化週期及資金支持,因此,Chiplets的分體式小芯片設計使得AMD可以在一顆處理器上使用不同的工藝製程(Core部分使用7nm工藝,而包含PCI-E 4.0控制器的IO部分則使用14nm工藝)。

其次,在第二代EPYC的架構中,每8個核心配合對應的L3緩存構成一個CCD(Core Complex Die),以一個獨立的DIE進行封裝。如果是滿配的64核產品,那麼8個CCD無疑是必不可少的;但如果是32核產品,如何排布就會有很大差異:即可以由4個滿配的CCD組成,也可以由8個屏蔽掉4核心的CCD構成。不過,由於每個CCD採用的是共享式的L3緩存,所以在第二種32核產品的構型中(8個CCD屏蔽掉一半的核心數量),我們就得到了L3緩存翻倍的新產品產品。這樣的全新組合方式能夠讓AMD在核心數量和主頻之外創造一個衡量性能(通過L3緩存容量的增加來提升執行效率)的新維度。

目前,在48核心產品上我們已經能夠見到類似設計的產品——EPYC 7642(2.3GHz,256MB L3)和EPYC 7552(2.2GHz,192MB L3)。而這一性能分級思路未來據悉也將應用在32核心產品上。顯然,這為緩存敏感型應用提供了一個全新的選擇。

在互聯總線上提供更多選擇

第二代EPYC的一大特點便是能夠在單插槽的情況下提供最高128個PCI-E 4.0通道。但目前用戶普遍認為,由於處理器互聯——xGMI總線與PCI-E總線共享整個外部IO帶寬;因此,一般情況下,雙路配置的第二代EPYC服務器所能提供的PCI-E 4.0通道數仍為128個。

但實際上,這種“普遍認知”並不完全正確。

補課——關於AMD服務器

AMD中國區商用事業部技術總監劉文卓

對此,AMD中國區商用事業部技術總監劉文卓表示:“每顆第二代EPYC處理器內部包含4條可以用於雙路系統中處理器互聯的xGMI總線。用戶可以選擇將4條xGMI全部用於處理器互聯,也可以選擇只使用其中的3條。”

補課——關於AMD服務器

AMD xGMI互聯總線示意圖(圖片來自STH)

在全部4條xGMI用於互聯時,雙路系統的確與單路系統一樣可以提供128個PCI-E 4.0通道;但如果主板製造商只使用3條xGMI通道進行互聯,那麼每顆處理器還將釋放相當於16個PCI-E 4.0通道的帶寬(兩顆處理器就可以多提供32個PCI-E 4.0通道),從而將雙路系統的PCI-E 4.0通道數量提升至160個(加上系統提供的額外兩個PCI-E 2.0通道,整個雙路系統最高可以提供162個PCI-E通道)。

當然,由於雙路系統xGMI互聯通道的不同,需要主板在佈線上進行對應調整,並且服務器PCI-E通道數量的變化需要通過物理插槽的多寡來體現。因此,第二代EPYC處理器在互聯方式上所體現出來的靈活性更多是面向主板製造商和系統製造商的。

所以,在處理器之間數據交流不甚頻繁的雲存儲、防火牆、軟件定義網絡等場景中,製造商可以選擇使用3條xGMI通道進行互聯,從而獲得更多的PCI-E通道數,進而獲得更好的系統擴展性;而在其他一些更需要處理器數據交換的領域,系統製造商則可以選擇4條xGMI通道全部啟用,以實現更好的系統整體性能。

全面發力企業生態

在產品端為用戶帶來全面性能提升和更多性價比選擇的同時,AMD也清醒地意識到了自身在企業應用生態方面的短板。目前,由AMD中國區商用事業部技術總監劉文卓領導的龐大FAE團隊已經全面開始了第二代EPYC軟硬件的支持工作,其內容涵蓋應用調優、Linux核心補丁、軟件編譯、HPC以及硬件平臺開發等。而在後端,面向全球的軟硬件工程團隊的支持也已經全面展開。

對此,劉文卓表示:“AMD已經組織了龐大的生態系統團隊來為新處理器和平臺進行應用相關的適配、調優和認證工作。而且,由於x86 64位指令集是AMD公司創建的,應用程序有著幾乎完整的兼容性。另一方面,AMD在行業內仍舊保持著廣泛的合作關係,所以相關工作進行得亦很順利。目前,很多用戶對第二代EPYC都非常感興趣,而從產品在用戶數據中心內的測試效果來看,即便在沒有進行針對性優化的前提下,第二代EPYC仍舊錶現出了非常好的性能。用戶滿意度很高。”

當然,要構建一個從硬件到應用的完整生態,單憑AMD的一己之力是不夠的,在更多情況下,應用開發商需要針對新平臺進行自主調優和適配。為此,AMD已經在8月初發布了全新的AOCC 2.0版本,其中包含了對Rome架構第二代EPYC全面支持和調優。通過新的編譯器,應用可以在第二代EPYC平臺上獲得最佳性能。

補課——關於AMD服務器

同時,使用Intel ICC的用戶也無需太過擔心。因為即便是在ICC上,第二代EPYC更多的物理核心和更優秀的架構也能夠帶來性能的大幅提升。因此,即便是Intel所主導的ICC也能夠發揮出第二代EPYC的絕大部分性能。

為什麼沒有四路產品?

在AMD看來,目前大部分四路產品看重的並不是單機的處理器性能,而是為了追求更高的單機內存容量,以滿足內存數據庫等應用的需求。而通過全新的8通道內存控制器,第二代EPYC已經能夠在單插槽支持高達4TB的ECC DDR4 3200,雙路系統的內存支持則直接翻倍為8TB。對於絕大多數內存數據庫應用來說,這個級別的內存容量支持已經完全夠用。

從大興數據中心入手,將競爭帶回市場

客觀來講,AMD仍舊是服務器市場中的追趕者,但好在AMD已經在產品和市場關注度上邁出了積極且成功的一大步。

以此為基礎,包括大型互聯網數據中心和全球各大服務器供應商在內的眾多用戶都已主動向AMD伸出了橄欖枝並提供了積極的反饋。

但AMD並沒有被第一步的成功衝昏頭腦,相反,AMD清楚地明白自身的優劣勢。劉文卓表示,在本代產品中,AMD將自己的定位明確為包括企業級和HPC在內的大型數據中心市場。

明確的定位能夠幫助AMD更有效地利用手上的資源和人力,把好鋼用在刀刃上,取得事半功倍的效果。當然,也只有在這片出貨量最大的市場站穩腳跟,AMD才能像蘇姿豐博士所說的那樣,將競爭帶回數據中心市場。


分享到:


相關文章: