為什麼維護工作讓數據中心工作人員夜不能寐?

數據中心的正常運行時間對於企業的業務成功至關重要,而確保不間斷服務需要維護人員時刻保持警惕和維護。隨著企業越來越多地部署業務關鍵型應用程序,這種對持續維護和依賴基礎設施的需求也在增加。

雖然運營商不斷創新以引入新的基礎設施管理工具,但許多工具仍然無法實現業界所追求的提高自動化和減少維護的要求。因此,許多IT專業人員仍在全天候地人工處理需要調整的問題。

運營商在與客戶溝通時不斷出現的一個主要痛點是維護週期仍然需要人為干預。此外,運營商將大部分預算用於保持數據中心持的續運營狀態,並大量支出運營預算。

這就產生了一個問題:儘管運營商不斷採用新的工具來處理這個問題,為什麼維護工作仍然讓數據中心工作人員夜不能寐。到底哪裡出現了問題?

傳統基礎設施工具的不足之處

真正消除管理基礎設施的負擔需要具有預見性,以便在問題發生之前預測問題,同時能夠提供對工作負載和資源的深刻洞察力,以便更好地優化基礎設施。

這就產生了一個問題:儘管運營商不斷採用新的工具來處理這個問題,為什麼維護工作仍然讓數據中心工作人員夜不能寐。到底哪裡出現了問題?

為了讓工作人員不再為數據中心維護而失眠。考慮以下四個因素來確定運營商的工具是否在克服令人沮喪的維護問題方面做得不夠:

1、不具備學習能力

只是提供本地系統指標的分析往往提供有限的價值。相反,運營商應該在工具中獲得的是能夠從數千個對等系統的行為中學習的能力,以幫助檢測和診斷髮展中的問題。從某種意義上說,可以集思廣益。

數據收集和分析的整體方法可以從大量的工作負載中彙集觀測結果。這允許在一個站點識別的罕見事件在另一個站點被預先避免,並且更準確地檢測更常見的事件。

2、未能看到整體情況

傳統工具通常只能以孤島的方式提供分析;每個設備僅提供系統狀態,這只是整個過程的一部分。由於在基礎設施堆棧中任何地方都會出現中斷應用程序的問題,因此有必要有能力跨多個層進行跨堆棧分析,以獲得更大的視野。這將需要諸如應用程序、計算、虛擬化、數據庫、網絡和存儲等關鍵組件。

3、不夠了解深入

預測建模需要深入的領域經驗—瞭解基礎設施堆棧中每個系統內的所有操作、環境和遙測參數。通用的分析只能如此深入。人工智能行業專家可以採用機器學習算法從歷史事件中識別因果關係,進而預測最複雜和最具破壞性的問題。

4、不能自主操作

也許傳統工具的最大缺點是無法採取自主行動。而在理想的自主操作狀態下,數據中心將是自我管理、自我修復和自我優化。從本質上講,他們應該能夠避免問題或改善環境,而無需管理員的人為干預。要實現這種自動化水平,需要經過驗證的自動化建議歷史記錄,以提供必要的信任和信心。

數據中心維護的未來

為了克服傳統工具的侷限性,並降低維護需求,以及使數據中心自動化——人們將不得不採用新一代的人工智能解決方案。這意味著利用能夠觀察、學習、預測、推薦並最終實現自動化的工具。

通過觀察,人工智能將能夠針對各種工作負載和應用程序開發對理想操作環境的穩態理解。深度系統遙測與全球連接相結合,可以實現快速的雲計算機學習,從而使人工智能工具能夠通過模式匹配算法快速預測問題。甚至可以根據過去的歷史配置和工作負載模式為新的基礎設施建模和調整應用程序性能。

基於這些預測分析,人工智能解決方案可以改善數據中心環境所需的適當響應,最後將消除IT團隊的壓力,他們不再需要通宵達旦地管理基礎設施,並尋找問題的根源。更重要的是,如果人工智能被證明是有效的,那麼可以在沒有IT管理人員干預的情況下自動應用。對於數據中心來說,這正是實現自動化的目標。

例如HPE公司的客戶利用人工智能工具在86%的時間內自動預測和解決問題。此外,他們在存儲問題上減少了85%的時間,甚至可以減少79%的IT存儲運營支出。因此,部署人工智能以協助數據中心基礎設施的優勢是不可否認的。

隨著技術進步促進市場發展,預計到2030年,一些國家和地區將面臨200萬IT專業人才短缺的情況。而自動化將成為數據中心管理的未來前沿技術。


分享到:


相關文章: