編譯自: https://opensource.com/article/18/9/linux-commands-process-management
作者: Alan Formy-duval
通過這些關鍵的命令來全程管理你的應用。
一般來說,應用程序進程的生命週期有三種主要狀態:啟動、運行和停止。如果我們想成為稱職的管理員,每個狀態都可以而且應該得到認真的管理。這八個命令可用於管理進程的整個生命週期。
啟動進程
啟動進程的最簡單方法是在命令行中鍵入其名稱,然後按回車鍵。如果要啟動 Nginx web 服務器,請鍵入 nginx 。也許您只是想看看其版本。
alan@workstation:~$ nginx
alan@workstation:~$ nginx -v
nginx version: nginx/1.14.0
查看您的可執行路徑
以上啟動進程的演示是假設可執行文件位於您的可執行路徑中。理解這個路徑是可靠地啟動和管理進程的關鍵。管理員通常會為他們想要的目的定製這條路徑。您可以使用 echo $PATH 查看您的可執行路徑。
alan@workstation:~$ echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin
WHICH
使用 which 命令查看可執行文件的完整路徑。
alan@workstation:~$ which nginx
/opt/nginx/bin/nginx
我將使用流行的 web 服務器軟件 Nginx 作為我的例子。假設安裝了 Nginx。如果執行 which nginx 的命令什麼也不返回,那麼是找不到 Nginx 了,因為它只搜索您指定的可執行路徑。有三種方法可以補救一個進程不能簡單地通過名字啟動的情況。首先是鍵入完整路徑 —— 雖然,我不情願輸入全部路徑,您會嗎?
alan@workstation:~$ /home/alan/web/prod/nginx/sbin/nginx -v
nginx version: nginx/1.14.0
第二個解決方案是將應用程序安裝在可執行文件路徑中的目錄中。然而,這有時可能是辦不到的,特別是如果您沒有 root 權限。
第三個解決方案是更新您的可執行路徑環境變量,包括要使用的特定應用程序的安裝目錄。這個解決方案是與 shell 相關的。例如,Bash 用戶需要在他們的 .bashrc 文件中編輯 PATH= 行。
PATH="$HOME/web/prod/nginx/sbin:$PATH"
現在,重複您的 echo 和 which 命令或者嘗試檢查版本。容易多了!
alan@workstation:~$ echo $PATH
/home/alan/web/prod/nginx/sbin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin
alan@workstation:~$ which nginx
/home/alan/web/prod/nginx/sbin/nginx
alan@workstation:~$ nginx -v
nginx version: nginx/1.14.0
保持進程運行
NOHUP
註銷或關閉終端時,進程可能不會繼續運行。這種特殊情況可以通過在要使用 nohup 命令放在要運行的命令前面讓進程持續運行。此外,附加一個& 符號將會把進程發送到後臺,並允許您繼續使用終端。例如,假設您想運行 myprogram.sh 。
nohup myprogram.sh &
nohup 會返回運行進程的 PID。接下來我會更多地談論 PID。
管理正在運行的進程
每個進程都有一個唯一的進程標識號 (PID) 。這個數字是我們用來管理每個進程的。我們還可以使用進程名稱,我將在下面演示。有幾個命令可以檢查正在運行的進程的狀態。讓我們快速看看這些命令。
PS
最常見的是 ps 命令。ps 的默認輸出是當前終端中運行的進程的簡單列表。如下所示,第一列包含 PID。
alan@workstation:~$ ps
PID TTY TIME CMD
23989 pts/0 00:00:00 bash
24148 pts/0 00:00:00 ps
我想看看我之前啟動的 Nginx 進程。為此,我告訴 ps 給我展示每一個正在運行的進程(-e)和完整的列表(-f)。
alan@workstation:~$ ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 Aug18 ? 00:00:10 /sbin/init splash
root 2 0 0 Aug18 ? 00:00:00 [kthreadd]
root 4 2 0 Aug18 ? 00:00:00 [kworker/0:0H]
root 6 2 0 Aug18 ? 00:00:00 [mm_percpu_wq]
root 7 2 0 Aug18 ? 00:00:00 [ksoftirqd/0]
root 8 2 0 Aug18 ? 00:00:20 [rcu_sched]
root 9 2 0 Aug18 ? 00:00:00 [rcu_bh]
root 10 2 0 Aug18 ? 00:00:00 [migration/0]
root 11 2 0 Aug18 ? 00:00:00 [watchdog/0]
root 12 2 0 Aug18 ? 00:00:00 [cpuhp/0]
root 13 2 0 Aug18 ? 00:00:00 [cpuhp/1]
root 14 2 0 Aug18 ? 00:00:00 [watchdog/1]
root 15 2 0 Aug18 ? 00:00:00 [migration/1]
root 16 2 0 Aug18 ? 00:00:00 [ksoftirqd/1]
alan 20506 20496 0 10:39 pts/0 00:00:00 bash
alan 20520 1454 0 10:39 ? 00:00:00 nginx: master process nginx
alan 20521 20520 0 10:39 ? 00:00:00 nginx: worker process
alan 20526 20506 0 10:39 pts/0 00:00:00 man ps
alan 20536 20526 0 10:39 pts/0 00:00:00 pager
alan 20564 20496 0 10:40 pts/1 00:00:00 bash
您可以在上面 ps 命令的輸出中看到 Nginx 進程。這個命令顯示了將近 300 行,但是我在這個例子中縮短了它。可以想象,試圖處理 300 行過程信息有點混亂。我們可以將這個輸出輸送到 grep,過濾一下僅顯示 nginx。
alan@workstation:~$ ps -ef |grep nginx
alan 20520 1454 0 10:39 ? 00:00:00 nginx: master process nginx
alan 20521 20520 0 10:39 ? 00:00:00 nginx: worker process
確實更好了。我們可以很快看到,Nginx 有 20520 和 20521 的 PID。
PGREP
pgrep 命令更加簡化單獨調用 grep 遇到的問題。
alan@workstation:~$ pgrep nginx
20520
20521
假設您在一個託管環境中,多個用戶正在運行幾個不同的 Nginx 實例。您可以使用 -u 選項將其他人排除在輸出之外。
alan@workstation:~$ pgrep -u alan nginx
20520
20521
PIDOF
另一個好用的是 pidof。此命令將檢查特定二進制文件的 PID,即使另一個同名進程正在運行。為了建立一個例子,我將我的 Nginx 複製到第二個目錄,並以相應的路徑前綴啟動。在現實生活中,這個實例可能位於不同的位置,例如由不同用戶擁有的目錄。如果我運行兩個 Nginx 實例,則pidof 輸出顯示它們的所有進程。
alan@workstation:~$ ps -ef |grep nginx
alan 20881 1454 0 11:18 ? 00:00:00 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
alan 20882 20881 0 11:18 ? 00:00:00 nginx: worker process
alan 20895 1454 0 11:19 ? 00:00:00 nginx: master process nginx
alan 20896 20895 0 11:19 ? 00:00:00 nginx: worker process
使用 grep 或 pgrep 將顯示 PID 數字,但我們可能無法辨別哪個實例是哪個。
alan@workstation:~$ pgrep nginx
20881
20882
20895
20896
pidof 命令可用於確定每個特定 Nginx 實例的 PID。
alan@workstation:~$ pidof /home/alan/web/prod/nginxsec/sbin/nginx
20882 20881
alan@workstation:~$ pidof /home/alan/web/prod/nginx/sbin/nginx
20896 20895
TOP
top 命令已經有很久的歷史了,對於查看運行進程的細節和快速識別內存消耗等問題是非常有用的。其默認視圖如下所示。
top - 11:56:28 up 1 day, 13:37, 1 user, load average: 0.09, 0.04, 0.03
Tasks: 292 total, 3 running, 225 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.1 us, 0.2 sy, 0.0 ni, 99.7 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 16387132 total, 10854648 free, 1859036 used, 3673448 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 14176540 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
17270 alan 20 0 3930764 247288 98992 R 0.7 1.5 5:58.22 gnome-shell
20496 alan 20 0 816144 45416 29844 S 0.5 0.3 0:22.16 gnome-terminal-
21110 alan 20 0 41940 3988 3188 R 0.1 0.0 0:00.17 top
1 root 20 0 225564 9416 6768 S 0.0 0.1 0:10.72 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.01 kthreadd
4 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 kworker/0:0H
6 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 mm_percpu_wq
7 root 20 0 0 0 0 S 0.0 0.0 0:00.08 ksoftirqd/0
可以通過鍵入字母 s 和您喜歡的更新秒數來更改更新間隔。為了更容易監控我們的示例 Nginx 進程,我們可以使用 -p 選項並傳遞 PID 來調用 top。這個輸出要乾淨得多。
alan@workstation:~$ top -p20881 -p20882 -p20895 -p20896
Tasks: 4 total, 0 running, 4 sleeping, 0 stopped, 0 zombie
%Cpu(s): 2.8 us, 1.3 sy, 0.0 ni, 95.9 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 16387132 total, 10856008 free, 1857648 used, 3673476 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 14177928 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20881 alan 20 0 12016 348 0 S 0.0 0.0 0:00.00 nginx
20882 alan 20 0 12460 1644 932 S 0.0 0.0 0:00.00 nginx
20895 alan 20 0 12016 352 0 S 0.0 0.0 0:00.00 nginx
20896 alan 20 0 12460 1628 912 S 0.0 0.0 0:00.00 nginx
在管理進程,特別是終止進程時,正確確定 PID 是非常重要。此外,如果以這種方式使用 top,每當這些進程中的一個停止或一個新進程開始時,top 都需要被告知有新的進程。
終止進程
KILL
有趣的是,沒有 stop 命令。在 Linux 中,有 kill 命令。kill 用於向進程發送信號。最常用的信號是“終止”(SIGTERM)或“殺死”(SIGKILL)。然而,還有更多。下面是一些例子。完整的列表可以用 kill -L 顯示。
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
注意第 9 號信號是 SIGKILL,通常,我們會發出比如 kill -9 20896 這樣的命令。默認信號是 15,這是 SIGTERM。請記住,許多應用程序都有自己的停止方法。Nginx 使用 -s 選項傳遞信號,如 stop 或 reload。通常,我更喜歡使用應用程序的特定方法來停止操作。然而,我將演示用 kill 命令來停止 Nginx 進程 20896,然後用 pgrep 確認它已經停止。PID 20896 就不再出現。
alan@workstation:~$ kill -9 20896
alan@workstation:~$ pgrep nginx
20881
20882
20895
22123
PKILL
命令 pkill 類似於 pgrep,因為它可以按名稱搜索。這意味著在使用 pkill 時必須非常小心。在我的 Nginx 示例中,如果我只想殺死一個 Nginx 實例,我可能不會選擇使用它。我可以將 Nginx 選項 -s stop 傳遞給特定的實例來消除它,或者我需要使用 grep 來過濾整個 ps 輸出。
/home/alan/web/prod/nginx/sbin/nginx -s stop
/home/alan/web/prod/nginxsec/sbin/nginx -s stop
如果我想使用 pkill,我可以包括 -f 選項,讓 pkill 過濾整個命令行參數。這當然也適用於 pgrep。所以,在執行 pkill -f 之前,首先我可以用 pgrep -a 確認一下。
alan@workstation:~$ pgrep -a nginx
20881 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
20882 nginx: worker process
20895 nginx: master process nginx
20896 nginx: worker process
我也可以用 pgrep -f 縮小我的結果。pkill 使用相同參數會停止該進程。
alan@workstation:~$ pgrep -f nginxsec
20881
alan@workstation:~$ pkill -f nginxsec
pgrep(尤其是 pkill)要記住的關鍵點是,您必須始終確保搜索結果準確性,這樣您就不會無意中影響到錯誤的進程。
大多數這些命令都有許多命令行選項,所以我總是建議閱讀每一個命令的 man 手冊頁 。雖然大多數這些命令都存在於 Linux、Solaris 和 BSD 等平臺上,但也有一些不同之處。在命令行工作或編寫腳本時,始終測試並隨時準備根據需要進行更正。
via: https://opensource.com/article/18/9/linux-commands-process-management
作者: Alan Formy-Duval 選題: lujun9972 譯者: heguangzhi 校對: wxy
本文由 LCTT 原創編譯, Linux中國 榮譽推出
閱讀更多 Linux中國 的文章