一分钟玩转云数据中心

一、云解决什么问题

1.1 云解决了效率问题。对于公有云,企业上云之前,自己运维基础架构,需要租用运营商机房、购买设备、上架设备、布各种线、配置网络、安排人员现场运维等,上云之后,不用关心基础架构问题,只需要在公有云WEB页面上点击就能完成这些需求,效率得以极大提高。对于私有云,还是需要自己运维基础架构,但云通过软件定义、资源池化、弹性伸缩、流程自动化等措施也极大地提高了资源供给效率。

1.2 云解决了成本问题。建一个云数据中心,成本要比传统数据中心高,对于公有云,其本身就是业务,各租户建数据中心的是重复工作,公有云SP集中建一个,节省下来的钱,一方面用于降低租户的成本,另一方面增加公有云SP收益。对于私有云,构建成本肯定比传统数据中心高,但可以通过提升运营效率来降低TCO成本,或者通过提升上层业务系统的竞争力,使得上层业务获得更多盈利,让业务反补私有云。

二、如何选择云

中小企业,对成本和效率敏感,上公有云是一种好的选择。大型企业,不差钱,安全性更重要,建私有云是一种好的选择。一些特殊行业,有监管要求,上行业云是一种好的选择。企业也可以根据自身需求,上混合云,比如,把重要业务放在私有云里,把不重要的业务放在公有云里,又比如,一年里,业务量低时,流量在私有云,业务量高峰期时,申请公有云资源,把流量牵引到公有云上,待业务量降低时,再牵回私有云,释放公有云资源。当然,云涉及生态链、政绩、人文等各种因素,企业可能有其他考虑。

三、如何建云数据中心

3.1、五化方针

标准化:设备规格标准化,资源池化,操作流程标准化

自动化:基于标准化的流程,实现流程自动化

服务化:对自动化流程进行封装,以服务形态,通过界面或接口对外提供技术服务或业务服务

自助化:允许用户在允许的配额范围内,自主消费服务资源,提供灵活性

智能化:自动化解决了确定性问题,智能化解决了不确定性问题

3.2、云技术栈

一分钟玩转云数据中心

云技术栈分为多层,下层通过标准接口向上层提供服务。第一层是应用编排,确定应用的逻辑架构、部署架构、副本数、是否多活等。第二层是PAAS,运行容器态应用。第三层是IAAS,提供ECS、EBS、VPC等服务。第四层是资源池,将资源池化,实现弹性供给。安全和监控贯穿真个云技术栈,为安全运营提供保障。

3.3、资源池化

一分钟玩转云数据中心

构建资源池,提供弹性供给,提高资源供给效率。资源池分为物理资源池和逻辑资源池,其中,物理资源池是通用设备上架、配置IPMI/PXE等,不确定具体用途,逻辑资源池基于物理资源池构建,安装相关软件系统,确定具体用途,例如宿主机逻辑资源池、SDS pool逻辑资源池。当逻辑资源池性能容量不足告警时,触发从物理资源池构建逻辑资源池流程,当物理资源池性能容量不足告警时,触发从库存上架构建物理资源池流程,当库存不足时,触发采购流程。

3.4、网络实现

一分钟玩转云数据中心

采用SPINE-LEAF架构,提高横向扩展能力,提高东西流量转发效率。小型规模企业,使用vlan实现隔离,大规模企业,特别是公有云,应使用vxlan大二层隔离,因为vlan只支持4k个,不能满足要求,而vxlan可以支持16m个。以vxlan为样例,为提高数据转发效率,可以采用在TOR上实现VTEP,SDN控制器在TOR上控制下发vlan-vxlan映射关系,在宿主机上的vSwitch上设置VM对应的vlan,上图中只是样例,实际情况一个宿主机有多个vSwtch。

3.5、计算实现

一分钟玩转云数据中心

同时支持虚拟机(VM)、裸机(BM)和小机。VM的宿主机上联TOR口设置为trunk,在VM连接的vSwitch口设置vlan。小机的上联TOR口设置为trunk,在小机连接的vSwitch口设置vlan。裸机上联TOR口设置vlan,裸机内部不做任何设置。在TOR统一实现vlan和vxlan转换。

3.6、存储实现

一分钟玩转云数据中心

同时支持SDS、FCSAN和NAS。SDS、FCSAN和NAS控制流均走HTTP API,SDS数据流走IP存储网络,FCSAN的数据流走FC光纤网络,NAS的数据流走租户数据网络。

四、云上的应用

4.1 适应DevOps

一分钟玩转云数据中心

DevOps开发运维一体化,能够实现快速迭代,提高市场竞争力。DevOps通过持续集成CI、持续交付CD、持续部署CD,实现快速迭代。通过Container和微服务加速DevOps落地,其中Container可以减少测试环境和生产环境差异,微服务可以每次只更改小模块,不必像单体应用那样需要重启整个服务,对业务影响大。

4.2 应用改造

如果要运行在IAAS上,应用要做p2v改造,如果要运行在PAAS上,应用要做p2c、v2c改造。要实现单体应用向微服务应用转换。外部访问web、web访问app、app访问db、app访问app均要进行DNS改造,实现应用解耦。

五、金融行业云

5.1 可用性和连续性要求

《商业银行业务连续性监管指引》中要求,重要业务系统RTO不得大于4小时,RPO不得大于半小时。业务系统的可用性需要从存储复制、数据库集群、应用多写等方面共同解决,从而达到4个9或5个9。

5.2 两地三中心要求:

银行监管要求,一千亿资产规模以下的银行要建同城双中心,一千亿资产规模以上的银行要建两地三中心,主中心和同城中心实现双活,异地中心实现灾备。云有AZ概念,但没有数据中心概念,AZ并不能完全等同于数据中心,因为AZ要求对等,即每个AZ地位作用一样,所以需要特殊考虑。

一分钟玩转云数据中心

5.3 隔离要求

银行数据中心内部要实现各种隔离,南北向的外网和内网隔离,东西向的等保隔离,生产和测试隔离等,也需要特殊考虑。

备注:本文为通用的云介绍,不涉及任何产品,希望对大家有帮助,有思考不周到的地方,欢迎批评指正。


分享到:


相關文章: