走進K1 Power——看IPS如何綻放Power之光

數字化轉型正在對傳統產業進行重塑,人工智能、雲計算、大數據……為千行百業的智能升級注入了先進生產力,與此同時,這些前沿技術對智慧計算場景的資源需求也呈現指數級增長。數據顯示,中國的關鍵應用市場將保持年均10%左右的提升,預計到2020年會有接近100億的規模。提到處理關鍵業務和密集型負載,相信Power會是很多企業的選擇。如今,圍繞POWER——這一體系結構和通用處理器工程設計領域的最佳實踐,開放的生態正使其發展得愈發繁茂,而浪潮商用機器有限公司(IPS)即是孕育這一片沃土的重要力量。

從1993年搭載10顆486 CPU的SMP2000,到2007年高效能服務器和存儲技術國家重點實驗室落戶浪潮,再到2010年400多位浪潮工程師耗費4年研製成功K1小型機,使得中國成為除美國、日本之外全球第三個具備關鍵應用主機研製能力的國家……直至2018年基於POWER處理器的K1 Power產品線上市,浪潮在國內高端小型機設計的道路上始終扮演著引領者的角色。然而,每一次成功的背後都是關鍵技術的突破,時至今日,浪潮商用機器有限公司副總經理黃家明仍記憶猶新。

走進K1 Power——看IPS如何綻放Power之光

浪潮商用機器有限公司副總經理黃家明

2010年32路安騰架構的機器出來時,面臨著一個大問題就是x86處理器通過緩存一致性協議的互聯,GPU要和主處理器共享內存。為了讓機器發揮更大的擴展效率,芯片之間要具備互聯網絡,但當時使用英特爾QPI協議連接要符合其處理器接口和規範,必須經過授權,如果是自主芯片之間使用QPI互聯是被禁止的,因此浪潮要自行研發高速協議網絡以實現緩存一致性。

“我們做了緩存一致性的協議處理芯片。這個芯片類似於一個沒有計算核心的處理器,但是能夠處理處理器核心之間通信的緩存一致性,這樣能夠把32路的安騰芯片結合起來,形成一臺機器來跑,這是國內的重要突破。”黃家明說。這枚芯片是專為與QPI協議對接設計的,可以和英特爾處理器通信,能理解每一次緩存、每一次內存事務的過程。這次互聯協議的技術攻關,為日後在其他平臺上做不同的協議實現奠定了研發基礎。

堅持自主創新,浪潮一直引領著國內高端小型機設計發展方向,突破了小型機多項核心技術,其中,浪潮自研的雙翼可擴展緊耦合體系架構,支持互連網絡單跳步32路擴展,獲得了PCT國際專利授權。在體系結構之上,浪潮消除了底層硬件差異化,在整機上開發了KUX操作系統,向上與UNIX接口兼容。關鍵應用層面,浪潮一方面支持IBM DB2的部署,另一方面對與Oracle最接近且兼容性最好的KDB數據庫進行移植,並且通過了IBM的嚴苛測試。

正是由於浪潮在架構設計和關鍵應用上的自研實力,為K1 Power的誕生鋪平了道路。目前,IPS在2019年上半年中國UNIX市場的佔有率已超過64%,以往購買過POWER8的金融客戶中,有80%是省、市級城商行,以及農信和全國的股份制銀行,這些銀行有80%均購買了IPS的設備,後者為舊版Power機器提供了平滑、無縫的遷移方案。核心客戶的認可足以說明K1 Power的過硬品質,而這也得益於IPS的一系列“秘密武器”。

“獨步江湖”的高性能體驗

作為瞄準核心業務應用的動力源泉,POWER處理器在性能設計方面的獨特性一直“獨步江湖”。通常,如果是x86處理器每個內核能支持2個線程,那麼POWER處理器的每個內核就可以有8個線程,8路多線程POWER處理器內核的平均性能幾乎是x86內核的兩倍。較上一代產品,POWER9處理器的主頻可以達到4GHz,每核性能提升40%,單核線程數提升4倍,L3高速緩存提升3.3倍,處理器互聯帶寬提升7倍,單處理器內存容量提升2.7倍,內存帶寬提升2倍,I/O總帶寬提升2倍,支持PCIe 4.0、NVLink 2.0、CAPI 2.0、New CAPI等協議。

“Power支持PCIe 4.0和NVLink 2.0,可以對CPU和I/O之間提供高帶寬支持,滿足關鍵應用負載的要求。”浪潮商用機器有限公司產品研發部副總經理尹宏偉表示,“K1 Power在商業數據庫如EDB、DB2和Oracle、SPARC這類應用系統上,都是兩倍以上的性能提升。對於開源的數據庫,我們的測試也是有兩倍以上的性能增長。”此外,整機性能更強的Power服務器還可以通過分區的形式滿足不同的應用負載,大幅提升資源使用效率。

在關鍵業務場景,Power一貫的Scale Up優勢使其在核心數據庫平臺能夠輕鬆處理大規模業務併發,而在像分佈式存儲、大數據、AI等新興的業務場景,Power同樣優勢明顯。例如在運行開源數據庫MariaDB時,搭載POWER9 LaGrange處理器的雙路FP5290G2較四路x86 6148平臺,每核性能提升1.6倍,CPU整體性能提升1.75倍。對於客戶應用來說,在同等功耗和同等計算空間內,得到了翻倍的性能提升,有效降低了TCO。

此外,IPS研發團隊還針對客戶具體需求進行定製化研發調優,使得K1 Power在特定場景下的運行能力顯著加強。浪潮商用機器有限公司產品營銷部總經理江豫京介紹稱:“前段時間,我們和國家某個證券相關機構做了POC測試,用K1 Power加上國產的存儲設備來搭建平臺,替換以前的系統。在僅遷移平臺(300個應用),還沒有做調優的情況下,我們的性能提升就讓業務時間節省了40%。因此,基於浪潮在高端服務器研發和設計的技術積累,結合POWER服務器的強大功能,我們有信心在關鍵業務和創新應用場景下為客戶帶來更多價值。”

不僅跑得快 還要跑得穩

就像一輛好的超級跑車,不僅要有飛一般的速度,跑得穩才是成功抵達終點的保障。穩定性、可靠性,以及設計、性能、服務等維度的高標準,是Power在設計之初就秉承的第一要務。通過引入RAS(Reliability、Availability、Serviceability)設計理念,並增加獨立的故障服務處理器等模塊,K1 Power要在部件、系統、測試、散熱等各個維度實現系統的穩定可靠。用黃家明的話說,半導體器繁多的顆粒總會出現或大或小的問題,處理這些問題需要多個業務部門的協作,所涉及的必要技術手段就是冗餘。

走進K1 Power——看IPS如何綻放Power之光

RAS設計理念

除了空間冗餘,即多路徑冗餘容錯,還要考慮到時間冗餘,與x86仿真指令可能出現的讀回故障導致宕機不同,Power支持的指令集重試和動態路徑選擇,使得其在遇到指令路徑訪問不通時,可以重新選一條路徑去訪問遠程的內存,這樣就大幅降低了故障率。即可理解為每個系統控制單元中有兩個冗餘的時鐘卡,通過線纜對系統提供冗餘的時鐘,當任意一個時鐘卡出現故障時,另一組時鐘可以無縫切換保持系統穩定運行。

無論是CPU與CPU之間,還是CPU與內存之間,亦或是內存DRAM芯片本身,IPS將冗餘做到了芯片級、鏈路級和板機佈線層面。例如在部件和鏈路上,電源的穩壓模塊做到了N+2的冗餘設計,相當於有多套變壓器把系統12V電壓分給板機的各個元器件使用,而x86則是一套變壓器供多個電壓給板機系統使用。對於電源、SMP線纜、時鐘、FSP模塊、I/O控制器等關鍵部件,IPS都做了冗餘設計。

除此之外,K1 Power還藉助多達16萬個故障檢查器,實時監測著系統運行狀態,對故障進行捕獲,並在故障擴散傳播之前隔離到限定區進行在線修復,甚至可以做到對CPU內部核心級別的故障隔離,確保系統持續運行。為此,IPS的首錯數據捕獲機制FFDC(First Failure Data Capture)在設計階段就在進行各類錯誤模擬,在實際運行階段會做錯誤捕獲。發生錯誤之後,在維護階段還可以做錯誤重現,把所有可能產生的錯誤提前做到預警、備案和處理。對於沒有糾錯機制的部件,K1 Power還支持重試機制,通過重試來判斷故障是否為真。

在黃家明看來,錯誤捕獲和隔離的RAS設計可以看作是Power的精華,“因為這部分RAS實際上涉及到了各個方面,而且每一項功能的實現都要從芯片出發,從板機的設計到系統的設計,以及操作系統的固件、BIOS,這就需要與負責操作系統的同事合作實現,因為操作系統裡面需要加入更多針對性的內核驅動去處理這些故障,涉及到內存的隔離、遷移,包括內存數據多副本的故障轉移等。這就要求有一個專門面向高可靠性設計的團隊。”

只做超出客戶預期的產品

筆者記得浪潮商用機器有限公司總經理胡雷鈞曾講述過一個生動的體驗:在地鐵建設過程中,有很多項目是需要趕工期的,有時候整個土建還沒有完成,信息化設備就進場了。機器裡面積了一層土,連芯片上面的字都看不見了,但Power的機器依然能夠穩定運行,而且是在高鹽、高蝕,高粉末粉塵的環境中。這樣高品質的機器所經歷的硬件設計考驗必定也是極端嚴格的。

由於Power處理的信號都是高速信號,對信號之間的干擾非常敏感,為了保證高速信號在CPU、內存、I/O、加速器之間傳遞的穩定性,所有與高速信號走線層相鄰的平面層都是地平面,以此更好的隔絕電子噪音造成的信號串擾。在板機設計時,K1 Power採用了40層混壓主板設計,做到每兩層信號之間都有一個D層,並且每一片主板都通過了IBM標準苛刻的熱力衝擊測試,實現100%可靠出貨。

散熱方面,K1 Power遵循“Less power, Less failure”的原則,在設計時就選用了低功耗的器件,提升零件可靠性,例如使用銦金屬片導熱材質而不是導熱膏,使得導熱效率提升近10倍,且長期有效。同時,還藉助動態分區散熱控制技術,讓各發熱區域獨立風扇轉速控制,提高散熱利用率,保障CPU等元器件性能穩定發揮。

深入到系統底層,K1 Power在挑選元器件和部件選型時有著更高的標準。例如使用的抗硫化電阻能夠在110度極限環境測試條件下較傳統電阻使用壽命高4倍以上,設計壽命遠超7年;鋁製框設計的風扇增加了自重讓系統減震效果更好,進而提升了系統性能和運行可靠性,設計壽命達到22年;穩定的自身散熱系統不僅能提升導熱效率,還可以在硫化環境下能避免老化。

為什麼Power的研發週期很長?有很大一部分原因是做了大量的仿真工作,將潛在風險提前消除。拿結構仿真來說,其包括結構應力靜態分析,振動及衝擊結構動態分析,可有效控制結構可靠性設計風險;再如散熱仿真,通過建立精度更高、粒度更細的散熱仿真模型,可提高散熱仿真的效率,降低服務器的散熱與能耗,提升整機可靠性;而電信號仿真,則通過建立高精度信號仿真,保障了Power產品信號傳輸速率,確保信號傳輸質量和抗干擾能力。

在仿真之後的檢測和測試環節,K1 Power的每一臺機器都會經過覆蓋率100%的功能測試,高端機型測試大項共計660多項,測試老化時間超過48小時,並且經過嚴格的Corner-test,確保每臺服務器都能夠在極限電壓和動態頻率下穩定工作。無論是檢驗覆蓋率還是測試強度,均比x86服務器高出不少。例如在PCB熱衝擊測試中,x86服務器對PCB的熱衝擊測試是緩慢升溫,然後再下去,而Power則是急劇升溫,維持一段時間再下去,測試標準更為嚴格。

定製能力決定與眾不同

可以說,IPS對Power的定製化開發能力,讓後者更上了一層臺階。從安全性來看,IPS在部件層通過自主研發確保了系統更加穩定,對所有的部件均有安全認證機制,類似於可信計算的方式使得Secure Boot引導時,如果操作者的指紋信息沒有在TPM芯片內錄入,就無法進行操作,新更換的部件在沒有經過認證前,也是無法安裝上運行的。在固件層面,經過檢驗的固件信息貼片於芯片內部,只有在工廠模式中才能寫入,用戶模式則無法進行修改。AIX操作系統安全加固模塊(K1 Power SSR)、國產可信計算模塊、符合商用密碼證書的外置硬件安全模塊(HSM)、自研的可信操作系統KUX……都是IPS為客戶保駕護航的獨門絕技。

從整合能力來看,IPS的技術團隊一直在思考如何結合x86的技術理念,拓展Power和OpenPOWER的產品邊界。例如,IPS為某客戶在兩顆OpenPOWER測試時,曾被要求把Power做到600瓦,於是在設計時把x86的整套固件包括電源控制和熱管理系統都移植到Power平臺,滿足了客戶需求;再如,IPS把IBM原來的Call Home功能、機器管理系統等都針對本地服務進行了自主設計;在模塊上,把TPM“改成了”PCM,符合了中國市場的標準。

由這種整合能力更進一步,即是浪潮成功的JDM模式——通過定製化生產交付的敏捷創新模式,這無疑更加適應互聯網時代的需求,也是IPS開拓新興市場的巨大優勢。尹宏偉認為,互聯網客戶的快速需求使得廠商沒有時間花費半年去測試產品,定製化可以更多地集成浪潮現有的產品或者架構,對重點需求進行局部開發,快速做出一類Power服務器來響應用戶。對於雲計算、AI這類新興的資源部署方式和技術應用,IPS也有著相應的解決方案,可讓關鍵數據庫運行在雲架構上,根據客戶需求做動態調整,而Power在I/O能力、內存通信帶寬、芯片互聯等方面的優勢,則為用戶提供了x86之外的互補甚至是更好的選擇。

綜上所述,IPS憑藉浪潮20多年在高端小型機上的成功經驗,為K1 Power的成功打下了堅實的基礎,並將這一優勢繼續發揚光大。自2018年5月2日正式運營以來,IPS以其過硬的產品品質、貼近客戶的需求定製,以及深厚的自主研發能力快速佔據了中國Unix市場,為Power打上了IPS的印記。K1 Power,不僅向x86客戶證明了什麼是物有所值,更為Power生態的發展之路描繪出了一個絢爛多彩的未來。


分享到:


相關文章: