智安网络讯:2018年4月美国纳税日故障归因于IBM磁盘阵列出现缺陷,本来有两次是可以避免的,第一次使用更新颖的微码包,第二次使用秘密的IBM脚本。
在2018纳税年的最后一个申报日4月17日,网上纳税申报系统瘫痪了11个小时,美国国税局(IRS)不得不将申报期延长了一天。
纳税申报系统基于大型机,使用几个高可用性磁盘阵列,按照企业存储服务(ESS)合同的条款规定,优利系统是主承包商,IBM是次承包商。
据美国政府本月发布的一份报告显示,其中一个磁盘阵列因缓存溢出而出现“热启动”(又叫暖开机)后出现了死锁状况,在美国东部标准时间(EST)02:24向IRS的管理人员发出警报,并在4月17日02:57 EST向IBM发出了call-home警报消息。
令人惊讶的是,它被归类为“严重级别3”警报,理应在下一个工作日结束前作出响应。
到03:30 EST,IRS的更多系统受到了影响;后来受影响的系统越来越多,让IRS苦不堪言,到07:45 EST共有59个系统中招,09:45 EST宣布“重大故障”。13:40 EST开发出了一个补救脚本,有限的纳税申报工作于15:00开始,17:00申报工作完全恢复如初。
实际上,IBM在9个月前的2017年6月就发现了问题根源的固件bug,并于2017年11月7日向公众发布了微码修复程序微码包88.24.6.0。
从IRS发布的报告中可以看出,导致这一事件发生的原因可以归纳为:人为错误、不够到位的程序以及被系统的单一故障点所伤害。
故障报告全文:
閱讀更多 智安網絡 的文章