深度观察|分布式存储到底是软硬一体还是软硬解耦?

近期,《中国移动超2亿元存储集采:为何偏爱软硬一体机?》引起业界不少热议和共鸣。从一些留言发现,软硬件解耦带来的维护与兼容性问题是最让大家头疼的,同时分布式存储走向超高密和超高性能的方向,让基于软硬一体的专属硬件成为新的关注点。

未来软硬解耦和软硬一体会走向哪里,现在还很难盖棺定论,业界的争议会长期存在。我们不妨一边争论着、一边观察产业的走向。

对此,本文试图进一步分析分布式存储软硬件解耦和一体的优劣,帮企业破除误解,算好分布式存储这笔账。

拨开云雾,浅析软硬解耦与一体的争议

争议一:分布式存储软硬解耦是经过大规模部署的最佳实践?

有人说,分布式存储的思想来源于互联网,并且互联网企业一直是分布式存储最大规模的用户群体。其普遍做法就是采购通用硬件,然后部署分布式存储软件。

而事实如此吗?我们知道,软硬解耦的建设模式之所以在互联网大行其道,很重要一点是他们有能力根据自身需求开发和维护分布式存储软件。而放眼政企用户,即便个别有此能力,如果不是海量的存储需求,其开发和维护边际成本会非常高。

前一篇文章里黄海峰也提到了,Amazon、Google、阿里、腾讯等互联网企业,也纷纷通过自研或收购的方式,推出自有的一体化硬件,满足多样性存储需求。如果说前十年互联网企业还热衷于分布式存储的软硬解耦模式的话,这些年他们已经开始拥抱专用硬件。

争议二:软硬解耦可以避免厂商锁定?

一些开源软件厂商以及服务器厂商宣称,存储软硬件解耦可避免厂商锁定:通过解耦实现软硬件的分开采购,可避免被单一厂商锁定。如果对软/硬件厂商不满意,可以随时更换,业务不受影响。

“厂商锁定”这个命题不仅仅在分布式存储领域,在整个IT领域大家都讨论得非常多。当用户使用了一个产品,并且这个产品是无法替代的,或者替代需要付出很高的成本,这种情况称之为锁定。

分布式存储是不可替代的吗?事实上无论是块、对象、文件还是HDFS,市面上都有很多替代产品。替代成本方面,任何产品的替代都会存在,用户至少需要买一台新的存储,然后在新旧设备间做数据迁移,这些都是有现成方案的,从这个意义上来说,不管是软硬解耦还是软硬一体,厂商锁定都是一个伪命题。用户担心厂商锁定,更多是认为所购买产品价值与价格的不匹配!

当某个产品能解决企业的核心痛点时,软硬解耦还是软硬一体不会成为一个核心问题。荷兰ASML光刻机,每台数亿美金,却还是供不应求。电视台持续采购EMC Isilon和华为OceanStor分布式存储用于高清编辑,虽然他们是采用专用硬件模式,但正因为如此,才能更好满足的4K/8K编辑高带宽、高可靠需求。

争议三:采用标准服务器让分布式存储运维更简单?

有一种说法,软硬一体产品对客户来说是个黑盒,用户很难做深度维护,必须求助厂商。而基于软硬解耦,采用的通用服务器作为硬件载体,坏了直接更换,扩容直接增加一台,上线快。

事实长服务器的维护与存储维护两码事,当通用服务器和分布式软件结合作为专业的存储使用时,反而让存储的管理更复杂。

一方面,软硬解耦降低了存储的使用门槛,用户可以DIY,但商用特性的缺乏,带来性能调优、故障定位、生产运维等都需要大量的学习成本,从这个意义上来讲是安装简单、使用复杂。

另一方面,用户面向不同场景的硬件很难归一化,比如计算型配置、存储型配置、均衡型配置,需要常备更多类型和数量的设备,同时需要遵循木桶原理,一个池的硬件尽量要保持一致,这些同样带来维护的复杂,让业务上线并非一帆风顺。

第三,软硬解耦还给客户带来了大量维护的负担。首先是部署时,需要协调软、硬件厂商的档期;使用期间,出现问题时厂商互相推诿;兼容性问题,软硬件厂家谁是第一责任人;并且由于来自不同厂商,软件无法对硬件进行全面的管理,反而带来更多的问题,导致软硬解耦恰恰是维护最复杂的一种模式。

争议四:软硬解耦可以引入竞争,降低采购价格?

服务器通常被认为价格相对透明,软件价格可控,因此软硬解耦可以通过引入更多厂商竞争,降低综合成本。

算这笔账的时候,我们必须要把隐性成本和OPEX考虑进去。采购成本是显性的,但综合成本还要包括使用和维护成本。以采购成本的少量节省,换来存储整体性能、可靠性、稳定性的大幅下降,往往得不偿失。

存储的附加增值更多是软件、质量控制、技术支持。用户花了很大力气分离采购回来软硬件部署上线后,慢慢就会发现省的钱相对于后期DIY的投入不值一提,原因很简单:在相同质量要求下,规模化工业生产永远比DIY综合成本低。

软硬解耦为了软件的通用性,牺牲了针对硬件的优化,难以发挥硬件最大价值。基于软硬一体,厂商摆脱了服务器的形态和规格束缚,将硬件规格、性能、密度做到极致,在满足同样需求的场景下,性能与密度大幅提升,考虑机房空间节省、耗电降低等Opex方面,综合成本也会降低不少。

产业方向,专属硬件必成众望所归

近年来,不管是传统存储厂商,还是新的分布式存储厂商,都开始投入大量资源,推出了一系列分布式存储产品,聚焦如何基于分布式架构及软硬一体的能力,来应对企业客户的海量数据挑战。

在北京举办的中国数据与存储峰会,就见证了这一趋势,分布式存储不仅成为了最火热的话题,专用硬件成为了各方关注的焦点。国内主要玩家,都带来了定制的分布式存储硬件。未来软硬一体和软硬解耦的鸿沟将进一步拉大!

为什么会形成这样的局面?通过与业界专家交流,分析有以下几点原因:

  • 首先,更好的硬件质量。存储和服务器的可靠性要求是不一样的,因此厂商对部件选择、生产制造流程都会更严苛,相应的成本也会略高。这样一来,一体化硬件设备可靠性就明显高于解耦的通用硬件。
  • 其次,更佳的需求匹配。比如市面上的服务器,比较常见的是2U 12/24盘位或4U 36盘位,但在高密归档的场景,这个密度还不够,因此,通过自主研发提供4U 60盘位/72盘位甚至更高密度的专用硬件,可以提供更低TCO,匹配客户降本增效需求。
  • 第三,更好的用户体验。考虑到大多数厂商都是基于Ceph架构开发,软件核心能力差距不大。而基于无差异的硬件设备,分布式存储同质化越来越严重,只有基于差异化的硬件,通过软硬结合对性能、可靠性、可维护性进行优化,才能形成差异化竞争力,让存储更快、更可靠、更简单。

智能时代,数据的爆炸式增长,将带来分布式存储的进一步普及,在更高性能、更高密度诉求的应用驱使下,分布式存储软硬一体的价值会进一步凸显。存储毕竟是一个专业领域,所有人都应该对数据存敬畏之心。而这个专业的领域,只有基于软硬结合才能找到业务本质,满足客户的真实业务诉求。至于软硬一体是否会统一江湖,不妨让子弹飞一会儿。


分享到:


相關文章: