对不起,我把Power服务器解剖了


对不起,我把Power服务器解剖了


一提到Power服务器,您的第一反应是什么?

我听到过某些行业客户这样说:

“那是电信、金融行业才用的,和咱关系不大。”

“有点小贵,我们可用不起!”

“好像有点‘封闭’吧,不是很开放?”


很多时候,“别人说”传达给我们的只是一些片面的信息,就像成语故事瞎子摸象所描述的那样。没有真正触摸或使用过Power服务器的人,可能永远都不会有那种真实的体验。不如来个狠的,把Power服务器解剖一下,也许会有完全不同的感受。说干就干!


01

Power服务器有“四高”


通常来说,人们会用“高性能、高可靠、高品质和高安全”这“四高”来概括Power服务器的典型特征。我们就沿着这个思路,对Power服务器做一个解剖。


Power系统的高性能应该是最没有异议和悬念的。


对不起,我把Power服务器解剖了


Power服务器最主要的应用场景就是电信、银行的核心数据库。就像一台车的动力来源是发动机,一台服务器的心脏就是CPU,它决定了系统整体的性能。Power处理器的强大体现在:具有业界最高的主频,可满足应用高负载运行的需求;具有更大的CPU之间的带宽,比如CPU与内存之间、CPU与I/O之间具有更大的带宽,内存带宽相对x86服务器有1.5~1.8倍的提升;Power支持PCIe4.0,而现有的x86只支持PCIe3.0;Power支持GPU的NVLink2.0协议……经实际测试,浪潮商用机器(IPS)K1 Power在运行全球主流商业数据库时,其性能是x86系统的两倍以上。Power服务器整机性能强劲、使用效率高、资源整合能力强,并可通过分区的形式满足不同的负载应用。


高可靠性是Power服务器与x86服务器之间最显著的红线,这有点像是豪华车与普通汽车之间的划分。


在使用初期,普通汽车在性能等各方面问题不大,但是几年之后,各种故障频出,它与豪华车之间的差距逐渐显露出来。从设计理念上看,Power服务器不但要保证强大的性能,更看重整个系统长期的高度可靠性。而实现这一点靠的就是RAS。比如,Power服务器采用了三个维度的容错设计:空间冗余,即多路径冗余容错;时间冗余,可以实现指令集的重试;信息冗余,即多重的数据校验。多重的冗余设计只有一个目标,就是保障整个系统能够持续稳定运行。


从硬件的冗余上看,Power服务器采用带外的、独立的故障服务处理器,例如FSP处理器,并且从部件、系统、测试、散热等各个方面采取严格的、高标准测试,以保证整个系统的高可靠。整个Power服务器的故障检查器多达16万个,遍布系统的各个方面,可实时监测系统的运行状态。从软件的保证上看,K1 Power采用首错数据捕获机制FFDC(First Failure Data Capture),在设计阶段就可进行各类错误的模拟,在实际运行阶段还会做错误捕获,一旦发生错误,在维护阶段还可以做错误重现,也就是针对所有可能产生的错误,做到提前预警、备案和处理。


其实,RAS的高门槛体现在,其每一项功能的实现都要从芯片出发,从板机的设计到系统的设计、操作系统固件、操作系统BIOS,协同一致。Power服务器高可靠的与众不同在于,它是一个整体的设计理念,旨在实现全站式的可靠性保障,同时还是细粒度的,面面俱到。达到这种级别的可靠性,不仅要有一个专门的高可靠性设计团队,还需要长期的积累和打磨。


对不起,我把Power服务器解剖了


Power服务器的高品质,其实就是“高质量+高可靠性”。


只有遵从高级设计理念生产出来的服务器产品才是高质量、高可靠的。举一个例子,Power服务器采用高达40层的主板设计,这是因为Power服务器的信号是高速信号,对信号之间的干扰非常敏感。所以,在板机设计时,为完全消除高速信号间的相互影响,保证高速信号的完整性,就必须做到每两层信号之间都有一个D层,而x86服务器可能只有表面和底层是D层,中间都是多层的信号。40层板的设计对制造和加工工艺提出了极高的要求,还要付出成本的代价。另一个例子是高效的散热设计。热与可靠性是密切相关的。Power服务器通过采用优质的导热材质、在CPU和散热器之间应用铟片,以及动态分区散热控制技术,提高了散热效率,保证了系统整体的可靠性。


Power服务器的研发周期相对较长,这是因为它做了大量仿真工作,将各种可能的风险在设计阶段就进行了有效规避。另外,Power服务器还采用了更高标准的检测和测试,每台服务器在出厂之前都要进行全检测,一些核心部件还会经过特殊的测试。


最后必须要说的是安全性。


Power服务器主要为了满足企业核心数据库、核心应用的需求,所以在安全上丝毫不敢马虎。Power服务器不会依赖于操作系统层面的安全性来保障整个设备的安全,而是会在一些更底层的技术层面做安全性的加固。比如,在部件层,Power服务器采用全自主开发的部件,以保证整个系统的稳定。另外,Power所有的部件维护都要通过严格的认证,确保系统一致性,不会被篡改。Power的安全功能设计,不仅仅涉及固件,更深入到底层的芯片,对硬件设计也有严格要求。


很多时候,品评一个产品的优劣,我们常说“是骡子是马拉出来遛遛”。今天,我们对Power服务器来了一次解剖,还不全面,但其独特的优势已经凸显出来。作为用户,有时可能会更多地看“眼前”或“短期”,比如性能指标、采购价格等。但实际上,一个产品是否适用、好用,还是要经过长期的使用和考验。特别是作为应用于核心应用中的服务器,长期的稳定、可靠、安全才是最重要的。这需要多年研发的磨练和积累,也需要大量、长期的客户实践来证明。Power服务器就是一个可以长期信赖的“伙伴”。浪潮商用机器自研的K1 Power发挥了Power服务器的优势,并且在国产、适配本地客户需求方面实现了创新,完全可以满足国内行业客户对核心应用安全、稳定、可靠运行的要求。


Power服务器的发展需要“传帮带”,更需要持续地创新,以及适配更多的应用场景。浪潮商用机器正是这样做的。


02

在追逐高端服务器的路上从未停歇


虽然2018年5月2日才正式营业,不过作为Power服务器在中国的“代言人”,浪潮商用机器在国内Non-X86服务器市场上已经拥有65%的市占率。浪潮商用机器一手抓传承,帮助现有客户平滑完成从POWER5、POWER6和POWER7向新一代Power平台的平滑迁移和转换,继续巩固传统优势的金融、电信市场;浪潮商用机器一手抓创新,除了在技术上不断提升K1 Power的能力,还积极拓展政府等更多潜力行业,并在大数据等新兴领域取得了显著突破。


不过不要误会,浪潮商用机器并不是一家贸易公司,除了Power服务器在中国的销售以外,公司挑起了从产品的开发到销售再到服务和解决方案的整副重担。浪潮商用机器的成立,为Power的开放式创新,尤其是生态的拓展和创新开辟了一条新路。浪潮商用机器现在可以从事板机的设计、固件的开发,以及K1、K-UX操作系统的制式兼容。Power的开放掷地有声。


浪潮商用机器赶上了好时候,客户对关键应用的重视、Power技术的开放,更重要的是,浪潮多年来在高端服务器上的布局、积累现在到了收获的时候。浪潮很早便开始了在小型机上的研发和战略布局。1993年,在浪潮董事长孙丕恕的带领下,浪潮研发出中国首台基于10颗486 CPU处理器的小型机SMP2000。突破高端一直是浪潮服务器的追求,但是苦于没有高端处理器,只能用x86处理器堆叠。之后,浪潮成立了高效能服务器和存储技术国家重点实验室,再加上国家开始投入资源,浪潮做高端服务器的条件逐渐成熟。2010年,浪潮推出了基于32路安腾处理器的高端服务器,其突破性不仅仅在于推出了一台高端服务器设备,而是通过自主研发,掌握了一系列开发高端服务器所必须的关键技术,比如处理器的互联、Scale-up的缓存一致性等。从此,浪潮捅破了那层通向高端服务器市场的窗户纸。


研发安腾服务器的过程并不像有些人说的那样,走了一段弯路。其实,正是这段经历,让浪潮加深了对高端服务器市场和客户需求的理解,也在一些关键技术上实现了突破,从而更加坚定了走向高端服务器市场的决心。这也为今天浪潮商用机器的成立埋下了伏笔。


早在2013年,浪潮便开始了与IBM合作的商讨。2010年浪潮推出安腾服务器的同时,也开发了一套与Oracle数据库最接近、兼容性最好的KDB数据库。为了将KDB数据库移植到IBM Power服务器上,浪潮还曾经调了两台自研的安腾服务器到IBM那里进行相关测试。通过上述沟通与交流,IBM对浪潮的研发能力也有了全新的认知。


浪潮商用机器成立后,在北京、济南建立了一支面向Power生态的专业开发团队,核心研发人员有100多人,主要围绕着Power架构做K1 Power的研发,包括了从板机设计到系统设计、固件和微码设计,以及测试验证、工程导入等各个环节。除了保证强大的单机性能以外,K1 Power研发团队在整个系统的可靠性、可扩展性、安全性和管理等方面也进行了深入思考,不断创新。


03

继承传统优势,迎来新商机


哲学家黑格尔有一句名言——“存在即合理”。Power服务器之所以长盛不衰,主要因为它是企业核心应用中不可或缺的一环。


当前,金融行业仍是应用Power服务器的主力军。在省级或市级的城商行、农信社和全国的股份制银行中,80%都采购了浪潮商用机器的Power服务器,主要用于支撑银行最核心的数据库资源池平台。旧版Power服务器上的资源可以平滑迁移至K1 Power服务器上。


2018年,政府行业客户Power服务器的采购有了大幅增长,整体翻了一番,采购主要集中在税务、公安、财政等细分领域,基本都是用新的Power服务器替换旧版的UINX小型机。


对不起,我把Power服务器解剖了


国内某运营商部署了2000多台基于Power处理器的Linux服务器,主要用于大数据应用,平均每台机器的工作负载超过75%。这也让人们看到Power处理器在新兴应用领域拥有更大的施展空间。


归纳来说,Power服务器的应用特色十分鲜明。在关键应用场景中,Power因其优异的纵向扩展性能和RAS特性,非常适合大型的核心数据库和大量业务并发的情况。同时在一些新兴业务场景中,比如分布式存储、大数据、AI等,Power服务器也都有机会。不久前,浪潮商业机器在国内某证券机构那里做了PoC测试,用K1 Power服务器搭配国产存储设备,在仅迁移平台并没有调优的情况下,5个月时间迁移了300多个应用,业务整体的处理时间缩短40%。


苹果、梨、西瓜、葡萄、樱桃等为什么好吃?因为他们都是嫁接的。嫁接既可以保证母本的优良基因,同时生长速度更快。Power技术+浪潮商业机器的国产服务器平台,可以更快地帮助国内客户在关键应用场景和新兴应用场景下带来更多价值。

$�\u0017.��T


分享到:


相關文章: