今年2月末,正當廣大中國人民處於疫情肆虐的水深火熱當中時,遠在大洋彼岸的英特爾推出了代號為Cascade Lake Refresh的至強可擴展處理器,也採用的是意料之中的14nm工藝。
從命名就能看出,這只是第二代至強可擴展處理器的一次小規模升級,而其Refresh的重點也圍繞著核心數量和主頻展開,可以看做是對去年推出的第二代Cascade Lake處理器的“快速迭代”。正式因為Cascade Lake所採用的14nm工藝已經用了太長的時間,雖然英特爾一直在升級推出+甚至++版本的產品,但在競爭對手已經全面過渡到7nm的狀況下,14nm已經疲態盡顯。
不過業內對於Cascade Lake Refresh依然有所期待,特別是那些迄今為止還在使用至強E5系列產品的用戶們。日前,國外一家名為Phoronix.com的硬件測試網站對至強Cascade Lake Refresh系列產品進行了多項測試,也正好能夠給準備升級的用戶們提供一些指導。
這次測試的產品主要針對英特爾至強金牌5220R和6226R處理器進行,測試平臺基於Ubuntu 20.04版操作系統(Linux 5.4內核)。測試全程採用了英特爾傲騰900p NVMe固態盤。為了體現出測試價值,他們還額外選擇了之前的英特爾Cascade Lake和AMD第二代霄龍處理器進行對比,具體參與測試的處理器型號包括——至強銀牌4216、至強金牌5218、至強金牌5220R、至強金牌6226R、至強鉑金8280、霄龍7302P、霄龍7502P、霄龍7252、霄龍7272、霄龍7302、霄龍7352、霄龍7532。
話說這波操作真的夠騷,為了體現對比列出了5款英特爾處理器和7款AMD處理器,但事實上我們大概只要1-2款對比產品就能夠看出性能差異。或許Phoronix是為了凸顯平臺的豐富性,不過這也就需要更多的測試時間和後期數據處理的時間。同樣,長長的圖表大家看著也可能會很累。
至強Cascade Lake Refresh處理器介紹
上圖就是本次介紹的主角了,因為是工程樣品,所以處理器頂蓋並沒有明確的型號標識,但是我們根據主頻可以判斷出左側的是至強金牌5220R,右側的是至強金牌6226R。
至強金牌5220R是24核處理器,支持超線程技術,擁有2.2GHz主頻、4.0GHz睿頻,以及35.75MB緩存;至強金牌6226R是16核處理器,支持超線程技術,擁有2.9GHz主頻、3.9GHz睿頻,以及22MB緩存。這裡可以看出,金牌處理器的型號和規格並沒有必然的聯繫,並非是6系列就比5系列更高端。
值得一提的是,從第二代至強可擴展處理器開始,散熱與能耗就成為了大家關注的問題。比如這次我們介紹的兩大主角,雖然隸屬於Cascade Lake Refresh”系列,但是他們的熱設計功耗都達到了150瓦,並可以支持英特爾傲騰持久內存。
Phoronix在功耗這一點上對於英特爾更為推崇,在他們看來英特爾Cascade Lake系列處理器能夠在原生層面支持Linux和BSD,而AMD只能通過其他產品組合實現對Linux的支持,而且還有更多改進的空間(比如Linux的散熱報告存在差距、AMD CPPC/CPU內頻增強功能等領域缺乏CPU封裝功耗報告、GCC / Clang編譯器對新功能的支持存在時間差等等)。
介紹到這裡,大家對於處理器的基本規格都有所理解,接下來要進入的就是測試環節。相對於其他網站來說,Phoronix有一套自己的測試軟件和標準,在報告中顯示“對被測CPU針對原始性能和性價比指標運行了幾十個基準測試”。
多項測試結果展示
Nas Parallel Benchmark是由美國國家航空航天局開發的一套代表流體動力學計算的應用程序集,中文翻譯為NAS並行基準測試程序。這一測試主要由8個程序組成,包括5個核心程序和3個模擬應用,分別從不同的方面反映了流體動力學計算的特點。測試的大部分計算是整數算術運算,另有7個基準程序是浮點密集型計算。
在NAS Parallel基準測試中,至強金牌5220R和6226R表現良好,性能在霄龍7302和霄龍7352之間。
接下來進行的是NAMD測試,NAMD是用於在大規模並行計算機上快速模擬大分子體系的並行分子動力學代碼,通過數值求解運動方程計算原子軌跡。
測試結果證明,無論是至強金牌5220R和6226R的性能都要比上一代的產品強出許多,當然在與AMD的競爭中還是不敵霄龍7532和7352,略微落後一些。
第三個測試是Nettle的加密工作負載中,在這項測試中英特爾家族全面領先,即便是上一代的銀牌產品也比最新的霄龍二代表現要好,當然這裡是基於單線程進行測試的。
第四項測試名為ArrayFire,這是一個簡化了開發的應用庫,主要針對並行和大規模並行架構(包括CPU,GPU和其他硬件加速設備)的軟件運行優化。圖中的成績是越低越好,所以在這裡我們也看到英特爾全面取得了領先,當然這也可能是基於硬件架構原因。
第五款測試軟件是大名鼎鼎的黑客工具John the Ripper。事實上這是一個快速的密碼破解工具,用於在已知密文的情況下嘗試破解出明文的破解密碼軟件,支持目前大多數的加密算法,如DES、MD4、MD5等。它支持多種不同類型的系統架構,包括Unix、Linux、Windows、DOS模式、BeOS和OpenVMS,主要目的是破解不夠牢固的Unix/Linux系統密碼。
這項測試結果證明了,如果你想作為黑客破解密碼的話,那麼更多需要依賴自己高超的技術而不是計算機的運行能力,事實上我們看到,至強金牌5220R和6226R的表現尚可,但還是略微落後於霄龍7532和7352,不過差距不大。
第六項測試可謂是“偏袒”英特爾了,因為這是英特爾自家的深度學習庫DNNL(近期改名為one DNN,成為oneAPI的一部分)。
不出意外,Cascade Lake Refresh CPU在運行英特爾自己的DNNL/one DNN針對AVX-512以及其它英特爾微架構功能進行了很好的優化,但同時,AMD霄龍處理器在運行這些英特爾開源軟件包時也擁有良好表現。
其實測試組也並非給與了英特爾特殊的關照,因為在dav1d測試項目中,AMD也得到了硬件加持。在dav1d AV1視頻解碼器等工作負載測試中,AMD霄龍全面超越了Cascade Lake,性能領先很明顯。
擁有英特爾OSPray光線追蹤引擎的至強金牌5220R/6226R CPU,其性能與定價相似的AMD霄龍7352處理器不相上下。
在OSPray測試中,至強金牌5220R/6226R雙插槽配置與霄龍7352 2P旗鼓相當。配置了英特爾Embree光線追蹤內核的霄龍7352,除了利用ISPC(英特爾SPMD項目編譯器,針對英特爾微架構進行了很好的優化)之外都有優勢。
其他英特爾開源軟件包提供的數字與預期基本一致。
得益於AMD霄龍二代有更多核心,這種優勢在LuxCoreRender等渲染工作負載上有明顯體現。但至少至強金牌5220R/6226R的性能表現也並不差,兩者各有勝負。
Phoronix得出結論:超高性價比
在經過了多項測試後,Phoronix終於認為全新一代的至強Cascade Lake Refresh與AMD第二代霄龍之間互有勝負,但是就售價來說至強Cascade Lake Refresh的競爭力更明顯,這種競爭力表現在兩個方面——
首先,就內部對比來說,至強Cascade Lake Refresh相比之前的至強處理器有較大的性能提升,同時價格定位的區間更為合理;而就與AMD的對比來說,雖然至強金牌5220R/6226R與霄龍7532和7352之間互有勝負,但是整體定位都在同一區間內。
而根據Phoronix提供的最終成績表現來看,至強金牌6226R和5220R的成績在本次測試的至強產品家族中處於頂層,而憑藉著雙路優勢甚至相對於霄龍7352來說也有4%和8%的提升。
而在談到價格定位的時候,Phoronix更用了“ It's great seeing”來表達對於Cascade LakeRefresh價格區間的肯定,並明確表示這樣會使得英特爾具備更高的性價比,也有利於在市場競爭中與AMD的較量。
後記
原文介紹到這裡就結束了,Phoronix的測試工程師們甚至一直在強調Cascade Lake Refresh的性價比優勢,強調價格區間的合理性,並認為這樣的舉措更有利於與AMD的競爭,的確製程落後的英特爾最近較為被動。
事實上,性價比一直不是大家選擇英特爾時首要考慮的問題,相反許多AMD的粉絲倒是願意將這個詞掛在嘴邊。而英特爾在企業級業務領域的佈局顯然更為廣闊,包括英特爾在x86平臺特別是在生態領域的影響力,包括英特爾除處理器之外還在積極佈局存儲、加速卡、網絡、軟件系統等全套體系,也包括我們剛剛提到的one API戰略等等,這些都是英特爾源於CPU卻又超越CPU的佈局。
但是對於這些,Phoronix的測試工程師們隻字未提,而是一再糾結於性價比的問題。我們更願意相信這是工程師的視野問題,但如果討論技術就應該止於技術,而不是再去談什麼性價比;如果談性價比,就自然免不了提到生態系統。
畢竟選擇英特爾一直代表著x86架構的“政治正確”,談性價比就輸了。