浪潮K1 能夠讓Power起死回生嗎?

隨著數字經濟的蓬勃發展以及企業數字化轉型的深入,特別是人工智能、雲計算等新一代IT技術的驅動,新的工作負載和應用場景對算力等提出了更高要求,企業亟需面向未來的擴展靈活、性能強大的系統環境和IT基礎設施。

浪潮K1作為國內高端服務器的典型代表,備受市場接納與認可。而Power也以高可用、高可靠、高品質和安全等特性,是業界備受青睞的IT基礎架構。而在浪潮商用機器的積極推動下,打造的K1 Power服務器產品為市場提供了多樣化的選擇。從設計、加工、測試、生產交付等環節,貫穿整個使用壽命週期的K1 Power服務器憑藉強大的性能以及開放、融合的多雲架構,正在成為企業應對數字化挑戰和驅動業務轉型的重要抓手。

浪潮K1 能夠讓Power起死回生嗎?

浪潮商用機器有限公司副總經理黃家明

浪潮商用機器有限公司副總經理黃家明表示,從研發的角度看,Power其實不再是一個封閉的系統,浪潮商用機器基於已有的小型機開發實踐對K1 Power服務器進行了全新的設計,從固件的開發、KUX操作系統到Linux、AIX(Advanced Interactive eXecutive)的兼容,Power的整個生態系統正在從封閉走向開放。

技術路線切換下的傳承與創新在小型機方面,浪潮一直引領潮流。1993年,浪潮成功研製出中國首臺小型機服務器;2007年,高效能服務器和存儲技術國家重點實驗室落戶浪潮,招募精英研發團隊在高端服務器和存儲領域進行全面研究;2010年,400多位浪潮工程師耗費4年研製成功K1小型機,突破多項小型機核心技術,使得中國成為除美國、日本之外全球第三個具備關鍵應用主機研製能力的國家,浪潮成為全球第五傢俱備關鍵應用主機研製能力的企業;2015年,K1系列小型機榮獲國家科技進步一等獎;2018年,基於POWER處理器的K1 Power產品線成功上市,在2019年上半年中國UNIX市場的市佔率超64%。

這一系列的亮麗成績來源於浪潮強大的研發團隊以及成功突破小型機核心技術。黃家明說,浪潮在小型機方面有著悠久歷史,進行了很多創新性的技術研發。比如高端服務器的最大困難是處理器的互聯以及內存一致性協議的技術。浪潮突破了這個技術,通過具有良好擴展性和容錯性的雙翼可擴展緊耦合體系架構,實現互連網絡單跳步32路擴展,可有效降低高端容錯計算機系統互連延遲,提高系統高可用能力。這樣成為我國首個獲得PCT國際專利授權的關鍵應用主機體系結構設計發明專利。

此外,在高速互連芯片方面,浪潮也實現了技術突破,成功研製出處理器協同芯片,使得中國成為繼美、日之後全球第三個掌握此核心技術的國家。在操作系統方面,KUX操作系統成為全球第五款,國內首款通過UNIX03標準認證的操作系統,國內唯一通過國家信息系統安全等級保護三級認證的Unix系統。K1榮獲2015年國家科技進步一等獎,標誌著中國的關鍵數據從此可以運行在自主平臺上,成為我國信息化建設自主可控戰略的重要佈局。

黃家明表示,正是這些創新研發技術為浪潮商用機器圍繞Power處理器進行K1 Power服務器的研發打下了堅實的基礎。現在浪潮商用機器研發團隊骨幹精英全部擁有10年以上高端服務器設計經驗,全程參與了浪潮K1、M13、4/8路x86等高端服務器產品的研發,是目前國內高端服務器研發領域最優秀的團隊。

同時,浪潮商用機器在北京、濟南兩大研發實驗室投資上千萬元配備PCIe 4.0誤碼儀、59GHz高速示波器、矢量網絡分析儀等頂級硬件研發測試設備,進行業界領先的高速信號真和測試。實驗室配備專業的電子設計自動化工具(EDA),研發專家團隊具有從系統原理到主板PCB設計的全流程設計能力,可對結構、電源、信號、散熱等服務器核心模塊進行快速研發。而且專業測試設備能快速診斷定位設計故障,打造可靠性高於99.9994%的高品質高端服務器產品。

在黃家明看來,從基於安騰的K1到現在的K1 Power,最大的區別是技術路線、技術架構不一樣。一個是Power處理器,一個是安騰處理器。得益於Power處理器的強大性能和一致性結構設計,系統架構更加精簡,這也省了開發方面的工作量。在整個系統拓撲方面,K1 Power並沒有改變,這樣保持了對上層系統和應用的最大兼容性。

浪潮商用機器在進行K1 Power設計的時候,會把原來在x86上面的一些在大規模環境下驗證過的設計導入進來,包括新的工藝、新的材料,這樣原來的Power在信號質量方面有一個很大的提升的,包括性能測試。黃家明還以功耗設計為例介紹說,通過把x86平臺上的電源控制和熱管理的系統移植到Power平臺,讓Power成功運行在了客戶指定的功耗水平上面。“通過整合浪潮和IBM的供應鏈,Power產品品質、性能、可靠性方面變得更好。無論是在經濟性還是在客戶需求滿足方面,K1 Power都表現更加出色。”

具備先進性的K1 Power是如何煉成的?K1 Power最顯著的特點就是單機性能,強調縱向擴展。但是當落實到設計層面,包括處理器的主頻和I/O擴展能力,它都是一個更高的數量級,這些對設計會有新的要求和挑戰。在性能、可靠性、可擴展性,包括安全方面和管理方面,浪潮商用機器進行了諸多思考。

浪潮商用機器有限公司產品研發部副總經理尹宏偉表示,從最早的安騰處理器技術路線轉到Power技術路線。浪潮商用機器把K1 Power打造成了一款高可用、高品質、高可靠和安全的服務器。“性能卓越、安全可靠、自主可控是K1 Power的顯著特點,在可管理性、能耗管理、安全性、可靠性、可擴展性、高性能等方面達到了一個新高度,並且通過部件品質、系統設計、製造工藝、生產過程、質量控制、流程管理等保證了K1 Power先進性。”

在系統高性能的維度,尹宏偉說,Power服務器最核心的應用還是核心數據庫應用,這就要求性能承載方面表現得足夠強大。POWER9處理器性能、內存與I/O帶寬優勢,讓K1 Power服務器在承載核心數據庫和開源數據庫方面性能優勢明顯。藉助PowerVM,K1 Power服務器高度整合核心業務負載。

尹宏偉表示,K1 Power服務器不但要保證強大的性能,更看重整個系統的高度可靠,這是它設計上的一個很大的訴求。在高可靠性方面,K1 Power服務器秉持高RAS設計理念,通過卓越的設計有效避免出現錯誤和降低故障可能,包括最高品質的部件、最低數量和功耗的部件、嚴苛的單個部件測試、高效創新的散熱設計、裝配和集成測試。比如服務處理器FSP偵測及診斷任何潛在錯誤的發生,通過硬件設計保證系統持續運行確保可用性,最大程度保證非停機修復故障實現可服務性。

此外,K1 Power服務器關鍵部件全部冗餘設計,包括冗餘DRAM芯片 、冗餘Fabric Bus、冗餘內存總線、冗餘I/O控制器、I/O櫃、I/O櫃鏈路、VIOS等實現可靠的系統設計。在系統時鐘冗餘方面,每個系統控制單元中有兩個冗餘的時鐘卡,通過線纜對系統提供冗餘的時鐘。當任意一個時鐘卡出現故障時,另一組時鐘 可以無縫切換保持系統穩定運行。電源時序控制信號冗餘設計實現更加可靠的電源開關控制。

K1 Power服務器多達16萬個故障檢查器實時監測系統運行狀態,遍佈全系統的錯誤檢查器及故障隔離寄存器,實時監測系統的運行,預測、報告故障的發生,自動觸發冗餘機制修復故障,首錯數據捕獲FFDC(First Failure Data Capture)、校驗與重試、隔離與修復。

尹宏偉說,K1 Power服務器堅持系統可靠性設計理念:Reliability + FSP + Availability + Serviceability,在物理可靠性、軟錯誤修復等方面實現系統全堆棧可靠性設計。

高品質實際上就是高質量或者是高可靠性。通過冗餘實現故障的處理、隔離修復,這些是屬於設計層面的。高品質是屬於實現層面的,K1 Power服務器的縱向擴展服務器的主板層數多達40層,確保良好的信號完整性,從而保證整體系統的可靠性。尹宏偉解釋說,高達40層主板設計為了保證高速信號在CPU、內存、I/O以及加速器之間傳遞的穩定性,所有與高速信號走線層相鄰的平面層都是地平面,以此更好地隔絕電子噪音造成的信號串擾。

K1 Power服務器還採用了高效散熱設計,包括選用低功耗器件,提升系統局部及整體可靠性;使用銦金屬片導熱材質,提升導熱效率近10倍;採用動態分區散熱控制技術,各發熱區域獨立風扇轉速控制,提高散熱利用率,保障CPU等元器件性能穩定發揮;通過合理的元器件佈局,降低高溫對元器件可靠性影響。此外,K1 Power服務器採用長壽命元器件及部件,提升部件結構化壽命。比如使用壽命22年的高可靠性風扇、遠超7年設計壽命的抗硫化電阻。

另外,浪潮商用機器藉助高精度仿真技術,降低設計風險,提升Power服務器整體設計品質和可靠性,涵蓋結構仿真分析包括結構應力靜態分析,振動及衝擊結構動態分析,有效控制結構可靠性設計風險,提高設計質量;建立精度更高,粒度更細的散熱仿真模型,提高散熱仿真的效率,降低服務器的散熱與能耗,提升整機可靠性;建立高精度信號仿真,保障Power產品信號傳輸速率,確保信號傳輸質量和抗干擾能力。

K1 POWER產品生產測試功能覆蓋率100%、自動化的測試系統,並對每臺產品都進行高強度的可靠性測試。自研部件在開發過程中進行嚴格的階段測試和整機測試,確保質量和性能達到業界最高水準;浪潮商用機器自認證部件結合IBM部件合格標準進行認證測試,確保引入部件的品質。

在安全性方面,K1 Power服務器進行了增強的系統安全設計,支持多種國際標準和中國政府認證,符合商用密碼證書的外置硬件安全模塊(HSM)。開發國產可信計算模塊(TPM),實現符合國家可信計算標準,AIX操作系統安全加固模塊(K1 Power SSR)。SSR(Server Security Reinforcement)是浪潮具有自主知識 產權的“操作系統安全增強系統”,是構建國家三級安全操作系統的內核模塊技術的解決方案產品,從根本上免疫現有的各種針對操作系統的攻擊行為,如:病毒,蠕蟲,黑客攻擊等。

黃家明說,K1 Power服務器本地化開發固件Secure Boot功能,通過對PNOR代碼的簽名及驗簽過程,保障代碼不被惡意篡改;自主構建系統微碼,源碼級安全檢測。另外,多家本地安全可信操作系統廠商認證了Power服務器平臺,並取得產品兼容性認證證書,為企業客戶提供系統多樣性選擇,包括KUX安全操作系統證書、凝思安全操作系統證書、紅旗操作系統證書、中標麒麟操作系統證書。

尹宏偉表示,Power服務器會從多個維度保證系統的安全、可靠和高性能。這種高標準只有在產品運行很長時間之後,我們才能發現這種高可靠的服務器和普通服務器的差距。“K1 Power服務器對於可靠性和性能的要求是很高的,這也是用戶長期對它品牌的認可。高性能高效率的K1 Power服務器也要遺傳這些基因,保證滿足核心用戶的核心應用安全、穩定、可靠地運行。”

加速落地 K1 Power深耕行業市場K1 Power服務器在行業市場表現不俗,在金融、政府傳統優勢市場獲得廣泛認可。浪潮商用機器有限公司產品營銷部總經理江豫京表示,省級或者市級的城商行或者是農信和全國股份制銀行都採購了K1 Power服務器,用於銀行最核心的數據庫資源池平臺。而且K1 Power服務器跟舊版Power機器的資源可以進行平滑遷移。

同時,K1 Power服務器支持關鍵業務雲架構,客戶可以根據需求進行動態調整。“我們去年在政府客戶這邊有了大幅度增長,整體翻了一番。稅務、公安、財政的客戶通過購買新的Power服務器來替換舊版UINX小型機環境,承載關鍵應用。”江豫京說,“除了面向關鍵業務的縱向擴展服務器,浪潮商用機器還推出了面向橫向擴展的基於POWER處理器的Linux服務器。這些服務器主要是承載新型工作負載,比如大數據、人工智能等。”

比如在AI方面,全新POWER9芯片具備NVLink 2.0、CAPI 2.0和New CAPI三位一體的領先硬件加速優勢,面向加速器件、異構綜合器件開放,大幅提升加速效率,深度學習框架性能超x86近4倍。大數據應用場景中,POWER9處理器內置的GZip硬件加速模塊不僅能夠極大地提高大數據分析平臺的數據傳輸效能,也使得數據壓縮和解壓縮性能提高了440~740倍。廣告推送算法加速引擎的性能評估中,利用PCIe上的FPGA加速卡,可獲得4.8倍的性能提升。

為了滿足客戶需求,浪潮商用機器採用JDM模式進行個性化定製,即實現面向客戶的聯合設計,在OpenPOWER和Power領域圍繞著客戶的需求進一步走向深化。

目前,浪潮商用機器以全新POWER9芯片為核心的縱向擴展系列和橫向擴展系列的產品矩陣不斷完善,能夠契合更多、更新的應用場景。同時,2019年浪潮商用機器將在既有的渠道體系基礎上進行升級,構建更加完整的合作伙伴體系。

“面對複雜的市場競爭形勢,浪潮商用機器致力於圍繞開源技術、開放技術的解決方案建設融合生態,通過合作打造更貼近客戶需求的產品和解決方案。我們很有信心利用Power技術,給客戶在關鍵場景和新應用場景下面帶來更多的價值。”江豫京說。


分享到:


相關文章: