阿里雲發說明解釋昨日故障原因:觸發了一個未知代碼Bug

訪問:阿里雲服務器

6月27日下午,眾多網友在微博反饋,稱阿里雲控制檯訪問出現故障,後臺登錄不上,包括圖片服務也已經掛掉。阿里雲官網的部分管控功能,及MQ、NAS、OSS等產品的部分功能也出現訪問異常現象,部分用戶反饋稱手機端和PC端均無法訪問。隨後阿里雲在官網發佈公告稱,部分管控功能出現訪問異常,受影響業務正逐漸恢復正常。

以下為阿里雲故障官方回覆原文:

6月27日阿里雲故障說明

6月27日下午,我們在運維上的一個操作失誤,導致一些客戶訪問阿里雲官網控制檯和使用部分產品功能出現問題,引發了大員吐槽。故障於北京時間2018年6月27日,16:21左右開始,16:50分開始陸續恢復。

經過緊急技術覆盤,故障原因如下:

當天下午,工程師團隊在上線一個自動化運維新功能中,執行了一項變更驗證操作。這一功能在測試環境驗證中並未發生問題,上線到自動化運維繫統後,觸發了一個未知代碼bug。錯誤代碼禁用了部分內部IP,導致部分產品訪問鏈路不通。後續人工介入後,工程師團隊快速定位問題進行了恢復。

受影響範圍包括阿里雲官網控制檯,以及MQ、NAS、OSS等產品功能。對於這次故障,沒有藉口,我們不能也不該出現這樣的失誤!我們將認真覆盤改進自動化運維技術和發佈驗證流程,敬畏每一行代碼,敬畏每一份託付。

阿里雲計算有限公司

2018年6月27日

阿里雲發說明解釋昨日故障原因:觸發了一個未知代碼Bug

相關文章:


分享到:


相關文章: