與 X86 正面交鋒,Arm 服務器芯片又掀狂瀾

電子發燒友網報道(文/張慧娟)在Arm服務器處理器陣營中,鮮少有從開始一直挺立到現在的,Marvell算其中一個。

現在仍然可以查到Marvell發表於2010年的媒體簡報,“Marvell今天發佈新款ARM架構嵌入式處理器ARMADA XP,將主要用於雲計算等企業應用領域,諸如高性能網絡設備、網頁服務器,以及家用NAS、媒體服務器等。運算內核包括四核心,頻率最高1.6GHz,擁有2MB二級緩存,其運算性能可達16600DMIPS,而功耗低於10W。”

今天看來,當時的配置和願景都過於樸素。

時間就這樣過去了十年。

這期間,Marvell對旗下業務大刀闊斧地進行了整並,移動芯片和多媒體芯片業務對外出售,基礎設施領域實力不斷強化,直到現在成為一家專注於基礎設施市場的半導體廠商,提供存儲、處理、網絡、無線連接和安全產品組合,服務器芯片地位越來越重。

今天,Marvell的服務器芯片主要聚焦三大應用市場:超算、雲端、邊緣,保持著兩年一代的上新節奏。

與 X86 正面交鋒,Arm 服務器芯片又掀狂瀾

一次咄咄逼人的上新

近日,Marvell基於第三代Arm的服務器處理器ThunderX3取得突破性進展。它專為當今雲計算和HPC市場上較嚴苛的工作負載而設計,可提供高性能、低功耗、高內存帶寬和低內存延遲,將於今年年中向客戶提供樣片。

Marvell半導體公司副總裁及服務器處理器部總經理Gopal Hegde指出,如今數據中心已從對單線程性能的關注轉向對機架級別性能的關注,其中性能功耗比、性能成本比和TCO(總擁有成本)是部署考慮的三大關鍵因素。因此,數據中心開始採用專為特定工作負載而定製的服務器。

相比上一代ThunderX2,ThunderX3實現了性能上的全面提升。據介紹,ThunderX3處理器採用臺積電7P製程工藝製造,擁有高達96個核,4線程/核心,每個插槽的總計算能力達到384線程。內存接口支持8通道DDR4-3200,每個通道可搭載2個DIMM。I/O擴展提供了64個PCIe Gen 4.0通道,搭載16個控制器。該處理器支持單節點和雙節點配置。在浮點運算方面,ThunderX3的每個核心搭載四個128位SIMD (Neon)單元。該設備完全符合SBSA/SBBR,並提供了企業級的RAS和虛擬化功能。

與 X86 正面交鋒,Arm 服務器芯片又掀狂瀾

ThunderX3的性能改進如何實現?Marvell半導體公司服務器處理器部產品營銷高級總監周立新告訴,主要來自於微架構的改進,使得IPC的整體性能較ThunderX2提高25%。結合處理器頻率和DDR頻率的提升,單線程總體性能較上一代提高了60%以上。在單顆處理器層面,相較於ThunderX2,ThunderX3的整數運算性能提升3倍以上,浮點運算性能提升5倍以上。

那麼,對於HPC市場來說,需要什麼樣的性能?周立新表示,HPC需要很多並行處理,ThunderX3每一個核有4個線程,最多96個核,可以支持384個線程。他強調,單核支持四線程,不論是x86架構還是其它Arm處理器,目前都沒有實現,ThunderX3在這方面實現了“數量級的差異”。

四線程跟單線程比,究竟有什麼好處?可以主要從三方面來看,一是SPECCPU,這是最標準的衡量服務器的指標;二是MySQL數據庫;三是Web搜索。根據測算,四線程比單線程有顯著的性能提升,特別是MySQL,可以提高80%的性能。

與 X86 正面交鋒,Arm 服務器芯片又掀狂瀾

當然,CPU不僅僅是計算指標,還涉及先進的DDR、PCIe。ThunderX3採用了PCIe 4.0,當年在ThunderX2,每個核裡面有2個128bit SIMD (Neon) Units,而ThunderX3提升到4個,這對超算、AI和機器學習來說非常重要。

談及對比於x86架構處理器的主要優勢,Gopal Hegde表示,x86架構面向服務器、桌面等眾多市場,而Armv8-A是專門面向服務器應用開發的核,在面積、性能、功耗層面更加優化。x86架構兩大廠商:英特爾在工藝上相比臺積電已落後一兩代,這對其x86服務器CPU性能有一定的影響;AMD在架構上採用封裝集成,64核有9個DIE,相應地在延時、帶寬方面存在不足,同時功耗偏高。

未來可能考慮Chiplet

各家由於情況不同,也有各自的實現路徑。比如AMD,其EYPC系列的成功與Chiplet技術的採用密不可分,它作為一種解決物理瓶頸的方法,Marvell是否會予以考慮?

Gopal Hegde談到,當時AMD的EYPC,如果把32核放在同一芯片中,物理上首先難以量產,就算生產出良率會比較差,所以不得不用4個Die來做32核。Marvell每個核的尺寸比AMD的約小30%左右,所以在ThunderX3中還可以集成這麼多核。他談到了一些不採用chiplet的優勢,比如內存帶寬,而且延遲也比較短。不過,未來再往下走,就算核再小早晚也會碰到物理瓶頸,那時可能也會考慮Chiplet方案。

盤點Arm服務器陣營的底氣

從Arm進入服務器市場的第一天起,整個業界就充滿了懷疑的論調,這種唱衰一路貫穿,甚至在高通正式取消其服務器芯片項目時達到頂峰。

不過,後面的故事越來越精彩,2017年,英特爾前高管離職創辦了從事Arm 服務器芯片研發的Ampere公司;2018年,富士通公開介紹了業界首款支持基於ArmV8指令集擴展SVE(Scalable Vector Extension)的A64FX芯片,據稱性能強悍到無需與GPU組合;2019年AWS推出的Graviton 2堪稱驚豔……

事實上,也正是從去年開始,業界推出Arm服務器處理器的節奏明顯加快,性能PK也更為激烈。國產陣營的代表有飛騰和華為,作為國內最早獲得ARMv8指令集架構授權的設計廠商,飛騰的CPU產品近年來不論是性能還是生態都成果頗豐;還有華為鯤鵬,正在通過全生態體系和產業鏈的整合能力高歌猛進。

為什麼Arm服務器生態開始呈現出前所未有的繁榮景象?Gopal Hegde認為,最顯著的原因是最終用戶發現Arm加速應用的時機已經成熟,才會有越來越多的人投入。

Arm框架的核心優勢在於低能耗、移動市場的高佔比。但是,服務器是一個跟生態密切相關的業務,現在整個市場x86架構還是佔據了90%以上的份額。本文發佈之時,英特爾剛剛公佈了2020年第一季度財報,其中數據中心業務同比增長43%,箇中原因這裡不去深究,但足以見得Marvell等面臨的是怎樣的對手。

那麼,Marvell競爭的底氣來自哪裡?

Gopal Hegde表示,生態層面其實是一種“滾雪球”效應,滾到一定地步就會自己越滾越大。自前兩年推出ThunderX2之後,部署進度在不斷加速,得到了諸多OEM廠商和平臺、IHV硬件廠商、操作系統和固件、中間件、應用和工具的支持,目前生態系統覆蓋已超過100家合作伙伴企業。微軟正為Azure部署基於ThunderX2的量產級服務器,也公開表態未來可能有40%-50%的量遷移到Arm平臺上。此外,ThunderX2系列服務器處理器已實現對NVIDIA GPU的支持,將進一步滿足HPC 和遊戲應用的需求。

比較聰明的一點是,正如Gopal Hegde在採訪中所澄清的,Marvell並非全線與x86競爭,只主抓生態成熟、且成長非常快的領域,就是超算和雲這兩塊,企業級的市場不會進入。

Arm架構在服務器市場進入了關鍵時期。諸多創新場景帶來的海量數據計算、存儲需求將孕育龐大的雲服務市場,對基礎計算架構產生了真正的多元化的需求。而先進算力的提升也確實需要多元化的構建,眼下這種繁榮的生態景象正是行業所需要的。

與 X86 正面交鋒,Arm 服務器芯片又掀狂瀾

聲明本文為電子發燒友原創,如需轉載或入群交流,請添加微信elecfans999,投稿爆料採訪需求,請發郵箱[email protected]

  • “新基建”正火,AI 底層支撐卻捉襟見肘……

  • TWS耳機大熱,這家國內藍牙SoC廠商獲科創板受理

  • 徹底火了!NB-IoT突破1億大關!加速衝擊10億!

  • 淨利潤暴增1954%!半導體界“巨無霸”是如何形成的?

  • 三位海歸創立的模擬半導體公司成功闖過科創板第一關


分享到:


相關文章: