運維程序員入門指南:運維職責和分類劃分詳解

很多人傻傻分不清楚運維具體是幹什麼的?有哪些分類?這很正常,孔子曰:術業有專攻,如是而已。還有一些新人小白想要進入這個行業,但是很懵懂,在剛剛接觸,心裡就打退堂鼓了,害怕自己學不會搞不定弄不懂。千鋒廣州雲計算運維小編這裡就為大家揭開這一職業的朦朧面紗。

運維程序員入門指南:運維職責和分類劃分詳解

前言

何為運維?運維,從字面意思很好理解,運行維護。有可能你認為的運維是高大上,坐在高檔寫字樓裡,敲敲電腦動動手指的,可能是風吹日曬走街串巷等等。

運維程序員入門指南:運維職責和分類劃分詳解

是的,這些都是運維,但是行業,分工以及內容都不同。總體來說大致可以分為兩類:線上運維和線下運維。而互聯網運維就屬於線上運維,共享單車運維就是線下運維。這裡我們聊得就是互聯網運維。

運維前景

要說運維的前景還是很廣闊的。可以這麼說只要有互聯網就會需要運維,試問下,現在的生活還能沒有互聯網嗎?所以,就業前景還是可以的。就企業而言,運維屬於技術職務,所以走的是P路線。什麼是P路線呢?是互聯網就個人職業規劃的上升和晉級通道,P路線就是技術路線,M路線就是管理路線。分不同等級,逐級或跨級晉升,當然不能等級體現了你的能力高低。我們常常自嘲為“打雜的”,因為運維是技術支持部門,是為開發出產品後上線提供支持的,所以很多東西都需要懂。所以如果想要從事這個行業先有個心理準備。技術方面有兩個維度:深度和廣度。就運維而言,廣度是第一要求,你不需要精,但是一定要知道。深度在根據自己的規劃方向再深入研究。就廣度來說,從網絡,服務器,系統,環境,應用,監控,虛擬化,容器化,自動化,智能化等等,需要學的太多了。還有,有人說:“運維是吃青春飯的”,對也不對,對的是做技術的,年齡大了操作和思維等肯定不如年輕人,不對的是:看能力,能力比較牛,不可替代,無論年齡多大都有市場。就單純的說運維晉升:初級,中級,高級,資深,架構師,CTO。少年,你做好準備了嗎?

運維分類

有很多程序員都是宅男,單身,過年過節回家,親戚朋友問到從事的職業被戲稱為修電腦的。但是隻要是從事技術的,哪怕是剛入行的小白,也能夠了解清楚分類,工具等。一般程序員根據開發語言劃分的,像:php,java, C++,Go等等,根據業務劃分可分為:前端和後端。這些基本就可以涵蓋所有了。而運維的分類是怎樣的呢?問什麼會讓很多人傻傻分不清和懵懂呢?各自有哪些職責呢?按職責劃分運維的分類大致可以分為應用運維,系統運維,運維研發,數據庫運維和運維安全。如下圖所示:

運維程序員入門指南:運維職責和分類劃分詳解

那下面我們就逐個介紹下。

應用運維

應用運維也是大部分人所認知的運維,應用運維根據字面意思就可以知道是和應用維護的。主要負責線上服務的發佈變更、服務健康狀況監控、服務的容災高可用和數據安全備份等工作。針對這些工作需要對服務進行巡檢瞭解服務狀況,服務出故障的應急處理和排查優化。下面詳細的職責如下所述。

運維程序員入門指南:運維職責和分類劃分詳解

評審

在產品研發階段,參與產品設計評審,從運維的角度提出評審意見,使服務滿足准入要求,儘快上線並預備高可用等方案。

服務

服務管理主要就是發佈系統,制定線上業務的升級變更及回滾方案,並根據申請進行變更的實施。掌握所負責的服務及服務間的依賴關聯關係中的各種資源。能夠發現服務上的缺陷,及時通報並推進解決。制定服務的穩定性指標及准入標準方案,同時不斷完善和優化程序和系統的功能、效率,提高運行質量,完善監控內容,提高報警準確度。在線上服務出現故障時,第一時間響應,對已知的故障能按流程進行通報並按預案執行,未知故障組織相關人員進行聯合排障。

資源

對各個服務使用的服務器資產進行管理,梳理服務器資源實時狀況、IDC數據中心分佈情況、網絡專線及帶寬情況,能夠合理使用服務器資源,根據不同服務的需求,分配不同配置的服務器,確保服務器資源的充分利用。

巡檢

實時瞭解服務的運行狀況,制定服務的例行排查點,並不斷完善。並根據制定的服務排查點,對服務進行定期檢查。對排查過程中發現的問題,及時進行追查處理,排除可能存在的隱患和痛點

監控

確定服務存活狀態正常,對服務的各項性能、系統的指標閾值或臨界點安排合理,以及對出現該異常後的處理制定預案。建立和更新和維護服務預案文檔,並根據日常故障情況不斷補充完善,提高預案完備性。週期性進行預案演練,確保預案的可行性。

備份

制定業務數據的備份方案,按策略對數據進行備份和冗餘工作。保證數據備份的可用性,完整性和安全性,定期開展數據恢復性測試。

系統運維

系統運維主要和系統及底層網絡等打交道,如:IDC機房、網絡拓撲、CDN加速和基礎服務的建設等;對所有服務器的資產進行管理,服務器的調研選型、交付上架和後期維護等。詳細的工作職責如下:

運維程序員入門指南:運維職責和分類劃分詳解

IDC機房

根據業務申請需求,預估未來數據中心的發展規模,從骨幹網絡的分佈,數據中心建築可靠性,以及Internet的接入、網絡中的攻擊防禦、擴容、空間預留、外接專線、現場支撐等方面。

網絡

設計及規劃生產網絡架構,這裡麵包括:數據中心網絡架構、傳輸網架構、CDN網絡架構等,以及網絡調優等日常運維工作。

基礎服務

根據網絡規模和業務需求,構建負載均衡集群,完成網絡與業務服務器的銜接,提供高性能、高可用的負載調度能力,以及統一的網絡層防禦能力;通過集群化部署,保證公網訪問服務的高性能與高可用。有些服務需要藉助於第三方的,對第三方進行測試選型和調度控制,監控等等,保障系統穩定、高效運行。

服務器

服務器的測試和選型,包含服務器整機、部件的基礎性測試和業務壓力測試,降低整機功率,規劃服務器上架位置,在保證溫溼度的情況下,提升部署密度,降低成本;服務器硬件故障的診斷排查和定位,服務器溫溼度轉速等硬件監控等;

操作系統

所有平臺的操作系統選型、定製和內核優化,以及漏洞補丁的更新和內部版本升級;建立統一的軟件包管理和分發中心庫,以及現在用的很多的maven依賴包倉庫和Docker容器倉庫;

資產管理

記錄和管理所有基礎物理信息,包括IDC數據中心、網絡信息、機架機櫃位置、服務器型號信息,售後信息等等各種資源信息,制定有效合理的流程,確保信息的準確性;

運維開發

運維平臺設計,開發和實施部署,如:用戶管理,資產管理、監控系統、發佈平臺、權限管理系統等等。提供各種接口,封裝更高層的自動化運維繫統。詳細的工作職責如下所述。

運維程序員入門指南:運維職責和分類劃分詳解

發佈平臺

記錄關聯關係,協助運維人員對日常運維標準化,流程化進而自動化,包括服務器的管理如:重啟、改名、初始化、域名管理、流量切換和故障預案實施等。

監控系統

監控系統的調研選型,對服務器和各種網絡設備的資源性能指標、業務性能指標的收集、告警、存儲、分析、展示和數據分析等工作,保證公司服務器資源的合理化調配,持續提高告警的及時性、準確性和有效性,對監控進行聚合,進而實現智能化報警監控。

自動化平臺

自動化系統的開發,自動化部署系統所需要的各種數據和信息。結合雲計算,區塊鏈等技術,研發和提供PaaS相關高可用平臺,提高服務的部署有效性和穩定性,提高資源利用率。

數據庫運維

數據庫運維需要對庫、表、索引和SQL等制定規範,對數據庫進行變更、監控、備份、高可用設計等工作。詳細的工作職責如下所述。

運維程序員入門指南:運維職責和分類劃分詳解

評審

在產品研發階段,參與設計方案評審,從DBA的角度提出數據存儲、庫表設計,索引設計等方案、SQL開發標準,使服務滿足數據庫的高可用、高性能要求。

容量

掌握所負責服務數據庫的容量上限,清楚地瞭解瓶頸點,當服務將觸及容量閾值時,及時優化、分拆或者擴容等

備份與災備

制定數據備份與災備策略方案,定期對數據進行恢復性測試,保證數據備份的有效性,可用性和完整性。

監控

對數據庫存活和各項性能指標監控,及時瞭解數據庫的運行狀態。

安全

建立數據庫賬號和權限控制體系,有效降低誤操作和數據洩露的風險;加強離線備份數據的管理,降低數據洩露的風險。

性能優化

對數據庫風險點有備用或切換方案,降低故障對數據庫的影響;對數據庫性能進行優化,包括存儲方案改進、硬件資源優化、文件系統優化、庫表優化、SQL優化等。

自動化

開發數據庫自動化平臺,包括數據庫部署、自動擴容、分庫分表、權限管理、備份恢復、SQL審核和上線、故障處理等。

運維安全

運維安全負責各方面的安全加固工作,進行安全掃描、滲透測試,進行安全工具和系統研發以及安全事件應急處理。詳細的工作職責如下所述。

運維程序員入門指南:運維職責和分類劃分詳解

安全文檔

根據公司內部的具體流程,制定切實可行且行之有效的安全方案和制度。

安全培訓

定期向員工提供具有安全培訓和考核,在公司內建立安全負責人制度。

風險評估

通過黑白盒測試和檢查機制,對網絡、服務器、業務、用戶數據等方面的風險評估。

安全

根據風險評估報告,加固薄弱環節,包括設計安全防線、部署安全設備、更新補丁、防禦病毒、源代碼自動掃描和業務產品安全諮詢等等。通過加密、匿名化、混淆數據,乃至定期刪除等技術手段和流程來降低可能洩露數據的風險。

安全合規

為了滿足合規性要求例如金融牌照,支付牌照等,安全團隊承擔著對外安全合規的接口人角色。

應急響應

建立安全報警系統,通過安全中心收集第三方發現的安全問題,評估影響面,組織各部門對已經發現的安全問題進行修復和事後造成安全的追查。

以上就是運維的種類和職責,千鋒廣州雲計算運維小編相信大家通過學習,也一定能找到合適的運維崗位!


分享到:


相關文章: