網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

楊工,我電腦不能上網了。

楊工,我無法連接總部VPN服務器了。

楊工,整個公司網絡都癱瘓了。

工作中我經常接到這樣的電話,也一般情況都能在段時間內解決,十幾年網工生涯幫我積累了非常重要的網絡故障排除經驗。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

故障管理是網絡管理中最基本的功能之一,它包括髮現並診斷故障、孤立故障和恢復故障三方面(孤立故障其實就是暫時性恢復故障,應急性地讓其它部門恢復網絡使用)。其中,診斷故障是網路故障管理的先決條件,網絡故障每次出現的現象也是形形色色的,沒有任何一種檢測方法或者工具可以診斷出所有的網絡問題。十幾年的網工積累的經驗就能少走彎路,輕鬆應對大部分的網絡故障。

結合理論和實際工作經驗可以分為三種方法:分層診斷、分段診斷和“望聞問切”仿中醫診斷。這三種方法綜合使用基本能排除所有的網絡故障問題,構成了一個立體網絡故障診斷模型。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

一、分層診斷網絡故障

就TCP/IP協議而言網絡包括物理層、鏈路層、網絡層、傳輸層、應用層五層。分層診斷從物理層開始,逐層向上檢查,直到應用層。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

1、物理層故障主要在線纜方面是否存在不連通、衰減等問題;

2、鏈路層故障主要在數據幀丟幀錯發問題,還有流量控制等問題;

3、網絡層故障主要在路由協議是否加載或者路由設置錯誤,還有IP地址、子網掩碼和網關等設置錯誤等問題;

4、傳輸層故障主要在防火牆、路由器訪問列表配置有誤,過濾限制了某些服務鏈接等問題;

5、應用層故障主要在操作系統的問題,如CPU、內存、I/O、核心進程等運行情況是否正常;應用服務是否開啟;服務器配置是否合理;安全管理、用戶管理是否存在問題等問題;

二、分段診斷網絡故障

分段診斷就是對網絡源端到目的端所經過網絡路徑及網絡設備進行分段處理,將網絡故障定位到某一段的設備或相應的連接線纜及附件上。這種診斷又細分為迭代診斷和子網分段。

1、迭代分段是從源端開始,檢查源端到網絡中某一節點是否工作正常,如沒問題,再檢查源端到更遠一個節點是否工作正常,以此類推,直到找到故障節點所在。

2、子網分段是用在不同的子網互聯時診斷網絡故障的方法。例如,有一種故障是兩個子網連接在一起就有問題,斷開其中一個子網就又正常了。

是不是想到了VLAN,對!有時候trunk模式設置出問題就會出現這個情況。

三、“望聞問切”仿中醫診斷網絡故障

中醫治療疾病時候,講究“望聞問切”。在網絡出現故障的時候,這種方法同樣非常適用。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

1、望

望就是看、觀察的意思。網絡故障排除中,我們也要先通過查看PC機和路由器的初始化信息,網絡設備的指示燈信息和操作系統或應用軟件運行速度,以達到網絡故障診斷和網絡維護的目的。

a、初始化信息是瞭解硬件信息和軟件版本,排查是否因為硬件特性或者軟件版本等問題導致不兼容情況出現,版本新舊的不對稱也會導致網絡故障。

b、設備指示燈是瞭解硬件是否處於正常工作階段。如網卡、交換機、光貓、路由器等面板上的LED指示燈。通常情況下,綠燈表示連接正常,紅燈表示連接故障,不亮表示無連接或線路不通。還有根據數據流量的大小,指示燈會時快時慢的閃爍。這些都是我們判斷網絡是否故障的重要依據。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

c、操作系統或者應用軟件運行速度快慢。有時候不一定是網絡問題,由於電腦中毒導致個體網絡變慢或者無法上網的情況比比皆是,甚至像ARP等網絡病毒影響的確實整個局域網,相當可怕。

2、聞

聞不單單是聞氣味,也包含聽聲音。計算機和網絡設備正常工作時,風扇和磁盤讀取數據發出來的聲音都是有規律的,如果出現異常聲響,就要採取緊急措施,如關閉電源等。正常工作的機房或者機箱是不會有異味的,如果有聞到塑料的焦糊味,往往是電源或者芯片出問題了。現在的網絡設備質量上基本沒啥問題,但也不排除出現這種故障的可能性。KB小網管所管理其中一機房的一臺H3C S3600交換機就出現風扇故障。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

3、問

問就是網絡故障時,應該向故障單位網管或者當事人詢問以下問題:

a、故障什麼時候出現?

b、故障表現是什麼,如連續故障,還是間斷故障。

c、故障發生的時候,操作者正在對計算機進行什麼操作?

d、網絡結構有沒有發生了什麼變化?比如新增路由器、交換機,以及網絡配置更改。

e、網絡用戶組發生變化了嗎?如由於工作關係一組用戶變為另一組用戶。域控環境。

f、是否新增或刪除廣域網路由?安裝了新協議了嗎?是否安裝了新服務器?

帶著這些疑問來了解問題,往往能夠對症下藥更快更直接地找到問題,排除網絡故障。

4、切

切在中醫上就是把把脈,用手敲兩下,基本上就能確定下來什麼病。同理網絡故障診斷的時候,藉助網絡故障診斷工具找到故障所在地方。如測線儀、第三方抓包軟件以及Windows自帶網絡命令工具等等。

網絡癱瘓了!到底哪裡出問題了?十幾年網工網絡故障排查經驗總結

相信大家已經看過我前面寫的Windows網絡命令系列的Ping命令和netstat命令,後期還有其他的命令合集,大家也可以在底下評論留言最想看到的命令詳解。


分享到:


相關文章: