观点:数据中心运营可以借鉴军队管理方式

观点:数据中心运营可以借鉴军队管理方式

Article by Schneider Electric Data Center Software Solutions vice president Domenic Alcaro --- 施耐德电气数据中心软件解决方案副总裁Domenic Alcaro撰写

Ponemon的一份报告发现,人为错误占所有计划外数据中心停机时间的近四分之一,Gartner称其平均每小时耗费300,000美元。

为了减少数据中心管理中的人为错误,我们最好从可能看起来不太可能的来源中吸取教训:美国海军,特别是核潜艇。

之前编者在外企工作时候,有2个美国同事就是从退役美军过来,其中一个就是做核设施相关运营。编者也参观过俄罗斯首都莫斯科的几个大型数据中心,负责运营的一把手都有军方工作背景,曾经最厉害的一个是负责战斗机的观察台,确保跑道和天气满足起飞下降要求。编者感觉运营最关键是有严格的流程和完善的监控系统,这点从本质上,军事设施和数据中心都属于关键设施管理。

核潜艇如何与数据中心技能相关

虽然核潜艇可能看起来像是与数据中心完全不同的野兽,但它们应该如何管理的相似之处却是惊人的,而且很多。

核子装置包含核反应堆装置,蒸汽装置,电气和冷却装置,辅助系统等等 - 所有这些都填充在子装置的后半部分。

您可以想象进入这样一艘船的复杂性,但海军通过实施详细的流程和政策成功地最大限度地减少了环境中的人为错误 - 并确保始终如一地遵循这些错误。此外,存在多级系统冗余和互锁,在许多情况下备用系统与备用系统。

尽管如此,每当涉及到人类时,你都无法完全消除人为错误的可能性。

在海军的情况下,它所能做的就是把重点放在船上服务的人身上。首先是竞争性的选拔过程,然后是水手到达之前的15个月的训练。一旦加入,强烈的培训和资格认证过程将无限期地继续下去。学习永不停止。

将核子课程应用于数据中心工作

今天的数据中心需要以同样的关键任务心态运营,因此数据中心设施管理者应遵循许多与海军相同的原则。

它首先雇用合适的人。施耐德电气毫不掩饰地为其数据中心设施运营小组寻找退伍军人这一事实,这些小组负责运营世界上最大的数据中心。

我们发现,退伍军人拥有在数据中心职业生涯中取得成功的正确背景。他们理解拥有记录良好的流程和程序的重要性,并虔诚地遵循这些流程和程序。

在数据中心,这意味着具有用于日常操作的标准操作程序(SOP)和用于执行维护程序的程序方法(MOP)。

具有易于记忆和易于获得的紧急操作程序(EOP)在危机时期也是无价的。

如果发电机无法启动或断路器意外跳闸,数据中心人员必须确切知道如何稳定数据中心。

美国海军正在接受有关使用状态板,变更控制流程和所有维护文档有条不紊地共享信息的正式培训。

这些都是运行任何关键任务设施(包括数据中心)的良好做法。

最后,数据中心人员,如那些核潜艇上的水手,应该始终在学习。

通过在职培训以及正规学校教育和定期演习进行的继续教育对于最大限度地减少人为错误和促进持续的流程改进至关重要。

这就是为什么施耐德电气为运营客户数据中心的人员提供正式的关键环境技术员(CET)培训计划的原因。

他们学习数据中心技能,包括如何有效使用EcoStruxure IT等高级监控和管理工具,以确保数据中心的正常运行时间。

该计划对于员工保留也至关重要,这是数据中心领域的一个大问题; 只要员工在学习,他们往往想留下来。

原文链接:https://datacenternews.asia/story/opinion-data-centre-management-can-learn-from-the-navy


分享到:


相關文章: