linux系統日常管理--監控系統的狀態+排查是否正被攻擊

2019-02-23 23:56:00 波波說運維

概述

工作中有時領導會說明天有業務，讓你去檢查下服務器，監控下系統的狀態是不是正常的，這時候我們需要查看哪些信息呢？下面從負載、進程、內存、網絡、網卡等幾個方面來介紹下怎麼去監控>

1. w查看當前系統的負載

參數說明：

第一行從左面開始顯示的信息依次為：時間，系統運行時間，登錄用戶數，平均負載。

第二行開始以及下面所有的行，告訴我們的信息是，當前登錄的都有哪些用戶，以及他們是從哪裡登錄的等等。其實，在這些信息當中，我們最應該關注的應該是第一行中的 ‘load average:’ 後面的三個數值。

第一個數值表示1分鐘內系統的平均負載值；
第二個數值表示5分鐘內系統的平均負載值；
第三個數值表示15分鐘系統的平均負載值。

這個值的意義是，單位時間段內CPU活動進程數。

當然這個值越大就說明你的服務器壓力越大。一般情況下這個值只要不超過服務器的cpu數量就沒有關係。

2. vmstat 監控系統的狀態

上面講的 w 查看的是系統整體上的負載，通過看那個數值可以知道當前系統有沒有壓力，但是具體是哪裡（CPU, 內存，磁盤等）有壓力就無法判斷了。通過 vmstat 就可以知道具體是哪裡有壓力。vmstat命令打印的結果共分為6部分：procs, memory, swap, io, system, cpu. 請重點關注一下r b si so bi bo幾列。

2.1、procs 顯示進程相關信息

r ：表示運行和等待cpu時間片的進程數，如果長期大於服務器cpu的個數，則說明cpu不夠用了；
b ：表示等待資源的進程數，比如等待I/O, 內存等，這列的值如果長時間大於1，則需要關注一下了；

2.2、memory 內存相關信息

swpd ：表示切換到交換分區中的內存數量 ；
free ：當前空閒的內存數量；
buff ：緩衝大小，（即將寫入磁盤的）；
cache ：緩存大小，（從磁盤中讀取的）；

2.3、swap 內存交換情況

si ：由交換區寫入到內存的數據量；
so ：由內存寫入到交換區的數據量；

2.4、io 磁盤使用情況

bi ：從塊設備讀取數據的量（讀磁盤）；
bo： 從塊設備寫入數據的量（寫磁盤）；

2.5、system 顯示採集間隔內發生的中斷次數

in ：表示在某一時間間隔中觀測到的每秒設備中斷數；
cs ：表示每秒產生的上下文切換次數；

2.6、CPU 顯示cpu的使用狀態

us ：顯示了用戶下所花費 cpu 時間的百分比；
sy ：顯示系統花費cpu時間百分比；
id ：表示cpu處於空閒狀態的時間百分比；
wa ：表示I/O等待所佔用cpu時間百分比；
st ：表示被偷走的cpu所佔百分比（一般都為0，不用關注）；

以上所介紹的各個參數中，我一般主要關注r列，b列，和wa列，三列代表的含義在上邊說得已經很清楚。IO部分的bi以及bo也是要經常參考的對象。如果磁盤io壓力很大時，這兩列的數值會比較高。另外當si, so兩列的數值比較高，並且在不斷變化時，說明內存不夠了，內存中的數據頻繁交換到交換分區中，這往往對系統性能影響極大。

注意：一般使用 vmstat 查看系統狀態的時候，通常都是使用這樣的形式來看的:

# vmstat 1 5

說明：每隔一秒鐘打印一次狀態，共打印5次。

3. top 顯示進程所佔系統資源

這個命令用於動態監控進程所佔系統資源，每隔3秒變一次。這個命令的特點是把佔用系統資源（CPU，內存，磁盤IO等）最高的進程放到最前面。top命令打印出了很多信息，包括系統負載（loadaverage）、進程數（Tasks）、cpu使用情況、內存使用情況以及交換分區使用情況。其實上面這些內容可以通過其他命令來查看，所以用top重點查看的還是下面的進程使用系統資源詳細狀況。這部分東西反映的東西還是比較多的。

PS：分享下我經常用的一個命令 top -bn1 它表示非動態打印系統資源使用情況，可以用在shell腳本中:

和 top 命令唯一的區別就是，它一次性全部把所有信息輸出出來而非動態顯示。

4. sar監控系統狀態

sar 命令很強大，它可以監控系統所有資源狀態，比如平均負載、網卡流量、磁盤狀態、內存使用等等。它不同於其他系統狀態監控工具的地方在於，它可以打印歷史信息，可以顯示當天從零點開始到當前時刻的系統狀態信息。如果你係統沒有安裝這個命令，請使用 yum install -y sysstat （或者apt-get install -y sysstat）命令安裝。初次使用sar命令會報錯，那是因為sar工具還沒有生成相應的數據庫文件（時時監控就不會了，因為不用去查詢那個庫文件）。它的數據庫文件在 “/var/log/sa/” 目錄下，默認保存一個月。因為這個命令太過複雜，所以我只介紹幾個。

4.1、查看網卡流量 sar -n DEV

參數說明： IFACE這列表示設備名稱，rxpck/s 表示每秒進入收取的包的數量，txpck/s 表示每秒發送出去的包的數量，rxbyt/s 表示每秒收取的數據量（單位Byte），txbyt/s表示每秒發送的數據量。後面幾列不需要關注。

如果有一天你所管理的服務器丟包非常嚴重，那麼你就應該看一看這個網卡流量是否異常了，如果rxpck/s 那一列的數值大於4000，或者rxbyt/s那列大於5,000,000則很有可能是被攻擊了，正常的服務器網卡流量不會高於這麼多，除非是你自己在拷貝數據。

上面的命令是查看網卡流量歷史的，如何時時查看網卡流量呢？

4.2、查看歷史負載 sar -q

這個命令可以查看服務器在過去的某個時間的負載狀況。

大家重點還是用來看是不是丟包和網絡情況吧！

5. free查看內存使用狀況

只需要敲一個 free 然後回車就可以當前系統的總內存大小以及使用內存的情況，還可以加-m 或者-g選項分別以M或G為單位打印內存使用狀況:

我一般用free -m方式查看內存佔用情況（兆為單位），而系統實際可用內存以及可用內存有如下幾個加減法：

used=total-free 即 total=used+free
實際內存佔用：used-buffers-cached 即 total-free-buffers-cached
實際可用內存：buffers+cached+free

6. ps 查看系統進程

監控進程的話這裡介紹一個專門顯示系統進程的命令，主要看下是不是有異常進程:

參數說明：

PID ：進程的id，這個id很有用，在linux中內核管理進程就得靠pid來識別和管理某一個程，比如我想終止某一個進程，則用 ‘kill 進程的pid 有時並不能殺掉，則需要加一個-9選項了 kill -9 進程pid

STAT ：表示進程的狀態，進程狀態分為以下幾種（不要求記住，但要了解）

D 不能中斷的進程（通常為IO）

R 正在運行中的進程

S 已經中斷的進程，通常情況下，系統中大部分進程都是這個狀態

T 已經停止或者暫停的進程，如果我們正在運行一個命令，比如說 sleep 10 如果我們按一下ctrl -z 讓他暫停，那麼我們用ps查看就會顯示T這個狀態

W 這個好像是說，從內核2.6xx 以後，表示為沒有足夠的內存頁分配

X 已經死掉的進程（這個好像從來不會出現）

Z 殭屍進程，殺不掉，打不死的垃圾進程，佔系統一小點資源，不過沒有關係。如果太多，就有問題了。一般不會出現。

< 高優先級進程

N 低優先級進程

L 在內存中被鎖了內存分頁

s 主進程

l 多線程進程

+ 代表在前臺運行的進程

這個ps命令是我在工作中用的非常多的命令之一，必須掌握的。關於ps命令的使用，小編經常會連同管道符一起使用，用來查看某個進程或者它的數量。

7. netstat 查看網絡狀況

netstat命令用來打印網絡連接狀況、系統所開放端口、路由表等信息。小編最常用的關於netstat的命令就是這個 netstat -nlp （打印當前系統啟動哪些端口）以及 netstat -an （打印網絡連接狀況）這兩個命令非常有用，請一定要記住。

如果你所管理的服務器是一臺提供web服務（80端口）的服務器，那麼你就可以使用 netstat -an |grep 80 查看當前連接web服務的有哪些IP了,再進一步可以netstat -an|grep 80|wc -l來查看大概有多少個連接。

8、抓包工具tcpdump

有時候，也許你會有這樣的需求，想監控一下某個網卡上都有哪些數據包，尤其是當你初步判定你的服務器上有流量攻擊。這時，使用抓包工具來抓一下數據包，就可以知道有哪些IP在攻擊你了。

如果沒有tcpdump 這個命令，需要用 yum install -y tcpdump 命令去安裝一下。上例中第三列和第四列顯示的信息為哪一個IP+port在連接哪一個IP+port，後面的信息是該數據包的相關信息，如果不懂也沒有關係，畢竟我們不是專門搞網絡的，而這裡需要關注的只是第三列以及第四列。-i 選項後面跟設備名稱，如果你想抓eth1網卡的包，後面則要跟eth1.至於-nn選項的作用是讓第三列和第四列顯示成IP+端口號的形式，如果不加-nn則顯示的是主機名+服務名稱。

篇幅有限，關於這一塊linux監控系統狀態的一些命令就介紹到這了，上面的命令都是很常用的，建議大家多去測試練習下！！

後面會分享更多關於devops和DBA方面內容，感興趣的朋友可以關注下！！

分享到:

閱讀更多 波波說運維 的文章

關鍵字: 監控中央處理器腳本語言

用 canal 監控 binlog 並實現Mysql定製同步數據的功能

Zabbix 監控

用 canal 監控 binlog 並實現mysql定製同步數據的功能的實踐

Nginx 監控

ZStack 3.8.0發佈！實現雲主機內部監控

Prometheus + Grafana 監控 SpringBoot項目監控系統

Spring Cloud快速入門（5），Hystrix服務熔斷、降級、監控

「Prometheus系列」實戰—Prometheus + Grafana——Nginx 監控

02.02 監控 Linux 服務器活動的幾個命令

Prometheus 監控 RabbitMQ

一線架構師詳解微服務技術架構、監控、Docker、服務治理等體系

Linux 怎麼入門？怎麼學好？今天給大家推薦點乾貨

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"