盤點曾經出現過的雲計算故障事件:騰訊、阿里、谷歌等都有發生!


2014年11月2日,騰訊雲服務器出現6分鐘的訪問故障,主要表現為網站響應速度慢,圖片無法打開,並出現無法登陸控制檯等問題。回應:主要是上海和廣州機房網絡抖動,導致用戶訪問困難,現已修復。

2015年6月3日,Apple iCloud 服務出現問題,電子郵件等無法讀取,iTunes出現服務宕機,而在此前iCloud服務多次出現宕機。回應:排查修復

2015年6月21日,阿里雲的香港節點崩潰13小時後被修復。回應:因香港運營商IDC電力問題所致,已責成香港運營商儘快完成機房整改措施。

2015年9月20日,亞馬遜DynamoDB服務出現問題,此後亞馬遜的其他服務器也受到影響,同時波及了很多著名網站。回應:排查修復

2016年8月11日,谷歌位於美國數據中心的APP Engine服務出現大面積故障,其中3%的應用出錯概率超過50%,18%的應用訪問出錯概率在10%到50%之間。回應:數據中心多臺路由器正在軟件更新,需要滾動重啟,網絡流量處理能力不如平常。同時,新遷移的許多應用由於啟動緩慢導致舊服務器大量重複向新服務器發送啟動應用的請求,進一步加重路由器負載,最終造成偶然丟失外部用戶的訪問。

2017年2月28日,亞馬遜AWS S3服務出現了“高錯誤率”影響了數千個在線服務,包括項目管理工具和費用報告工具等。回應:排查修復

2018年6月27日,阿里雲網控制檯和使用部分產品功能出現問題。回應:工程師在上線一個自動化運維新功能中,執行了一項變更驗證操作,這一功能在測試環境中並未發生問題。上線到自動化運維繫統後,觸發了一個未知代碼buy,錯誤代碼禁用了部分內部IP,導致部分產品訪問鏈路不通。


分享到:


相關文章: