Linux：“awk”命令的妙用技术頭條網

2019-08-20 15:26:54 邊緣人

awk是一個強大的文本分析工具，簡單來說awk就是把文件逐行讀入，（空格，製表符）為默認分隔符將每行切片，切開的部分再進行各種分析處理。

0、基本用法

awk是一個強大的文本分析工具，簡單來說awk就是把文件逐行讀入，（空格，製表符）為默認分隔符將每行切片，切開的部分再進行各種分析處理

awk命令格式如下

awk [-F field-separator] 'commands' input-file(s)

[-F 分隔符]是可選的，因為awk使用空格，製表符作為缺省的字段分隔符，因此如果要瀏覽字段間有空格，製表符的文本，不必指定這個選項，但如果要瀏覽諸如/etc/passwd文件，此文件各字段以冒號作為分隔符，則必須指明-F選項

echo "this is a test" | awk '{ print $0 }' 
## 輸出為 
this is a test

shell讀取用戶輸入的字符串發現|，代表有管道。|左右被理解為簡單命令，即前一個（左邊）簡單命令的標準輸出指向後一個（右邊）標準命令的標準輸入

awk會根據分隔符將行分成若干個字段，$0為整行，$1為第一個字段，$2 為第2個地段，依此類推…

為打印一個字段或所有字段，使用print命令。這是一個awk動作

echo "this is a test" | awk '{ print $1 }' 
## 輸出為 
this 
echo "this is a test" | awk '{ print $1, $2 }' 
## 輸出為 
this is

/etc/passwd的文件內容如下

root:x:0:0:root:/root:/bin/bash 
bin:x:1:1:bin:/bin:/sbin/nologin 
daemon:x:2:2:daemon:/sbin:/sbin/nologin 
adm:x:3:4:adm:/var/adm:/sbin/nologin 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

舉幾個簡單的小需求

1、只顯示/etc/passwd的賬戶

awk -F : '{ print $1 }' /etc/passwd 
## 輸出為 
root 
bin 
daemon 
adm 
lp

2、顯示/etc/passwd的第1列和第7列，用逗號分隔顯示，所有行開始前添加列名start1，start7，最後一行添加，end1，end7

awk -F ':' 'BEGIN {print "start1,start7"} {print $1 "," $7} END {print "end1,end7"}' /etc/passwd 
## 輸出為 
start1,start7 
root,/bin/bash 
bin,/sbin/nologin 
daemon,/sbin/nologin 
adm,/sbin/nologin 
lp,/sbin/nologin 
end1,end7

BEGIN語句在所有文本處理動作執行之前被執行，END在所有文本處理動作執行之後被執行

3、統計/etc/passwd文件中，每行的行號，每行的列數，對應的完整行內容

awk -F : '{ print NR " " NF " " $0 }' /etc/passwd 
## 輸出為 
1 7 root:x:0:0:root:/root:/bin/bash 
2 7 bin:x:1:1:bin:/bin:/sbin/nologin 
3 7 daemon:x:2:2:daemon:/sbin:/sbin/nologin 
4 7 adm:x:3:4:adm:/var/adm:/sbin/nologin 
5 7 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

1、支持內置變量

上面示例中NR，和NF其實就是awk的內置變量，一些內置變量如下

變量名 解釋
FILENAMEawk瀏覽的文件名
FS設置輸入字段分隔符，等價於命令行-F選項
NF 瀏覽記錄的字段個數
NR 已讀的記錄數

2、支持函數

輸出字符串的長度

awk 'BEGIN { print length("this is a text") }'

## 輸出為

將/etc/passwd的用戶名變成大寫輸出

awk -F ':' '{ print toupper($1) }' /etc/passwd

## 輸出為

ROOT 
BIN 
DAEMON 
ADM 
LP

常用函數如下

函數名 作用
toupper(s)返回s的大寫
tolower(s) 返回s的小寫
length(s) 返回s長度 

substr(s,p) 返回字符串s中從p開始的後綴部分

3、支持條件操作，正則表達式匹配

顯示/etc/passwd中有daemon的行

awk -F ':' '$0 ~ /daemon/' /etc/passwd

## 輸出為

daemon:x:2:2:daemon:/sbin:/sbin/nologin 
awk條件操作符
操作符\t描述
< 小於 < = 小於等於 == 等於 != 不等於 ~ 匹配正則表達式 !~ 不匹配正則表達式

4、支持流程控制語句，類C語言

if while do/while for break continue

輸出第一個字段的第一個字符大於d的行

awk -F ':' '{ if ($1 > "d") { print $1 } else { print "-" } }' /etc/passwd

## 輸出為

root 
- 
daemon 
- 
lp

可以把流程控制語句放到一個腳本中，然後調用腳本執行，如test.sh的內容如下

{ 
 if ($1 > "d") { 
 print $1 
 } else { 
 print "-" 
 } 
}

用如下方式執行，效果一樣

awk -F ':' -f test.sh /etc/passwd

## 輸出為

root 
- 
daemon 
- 
lp

5、應用場景

小編用awk進行文本分析比較少，主要用來寫腳本

如一個weibo-interface-1.0.jar應用，啟動腳本如下

start.sh
nohup java -jar weibo-interface-1.0.jar >out 2>&1 &

關閉腳本如下，kill.sh

kill -9 `jps -l | grep 'weibo-interface-1.0.jar' | awk '{print $1}'`

jps -l的輸出如下

70208 com.st.kmp.main.KmpService 
31036 com.st.cis.main.BaiduAnalysisService 
66813 weibo-interface-1.0.jar

還有就是關閉hadoop集群的所有DataNode節點（不知道hadoop的可以認為DataNode是一個集群應用），假如一個個機器jps，查看pid，kill。很麻煩，直接寫了一個腳本，依次ssh到各個節點，然後執行如下命令即可

kill `jps | grep 'DataNode' | awk '{print $1}'`

jps的輸出為

508 DataNode 
31481 JournalNode 
31973 NodeManager

分享到:

閱讀更多 邊緣人 的文章

關鍵字: 文本分析 Bash 標準

Linux：“awk”命令的妙用

相關文章:

Linux：頁表中PGD、PUD、PMD等概念介紹

Linux FAT 文件系統預讀缺陷，補丁提升 7 倍性能

Linux 下epoll 網絡模型 為什麼需要epoll?

Windows 支持直接訪問 Linux 子系統文件：你的下一臺 Linux 何必是 Linux

體驗 DebianDog：Puppy 式的 Debian Linux

Linux 最常用命令：簡單易學

kali Linux 筆記

2020 Kali linux root權限修正版

Linux 用戶登錄記錄

Linux 內核到底長啥樣？

如何在 Linux 中更改 MAC 地址

linux 查看機器cpu核數

一文看懂如何使用 Linux seq 命令生成數字序列

Linux 系統查看服務器SN序列號以及服務器型號

免費在線試用 200+ Linux 和 Unix 操作系統

03.07 Linux 下進入文件，提示沒有那個文件或者目錄問題

玩轉 Linux，掌握這些 Linux 命令就夠了

03.04 玩轉 Linux，掌握這些 Linux 命令就夠了

03.01 Linux 常見高危操作

02.27 Linux 守護進程創建原理及簡易方法

Kali-Linux-2020.1 安裝/Live USB啟動盤製作

樹莓派 Linux 操作系統大全

02.22 玩轉 Linux，掌握這些 Linux 命令就夠了

「LINUX」乾貨：文件批量轉換為UTF8編碼-enca

linux poll機制

優麒麟UKUI桌面環境登陸Arch Linux

比 Deepin Linux 更好的 Linux 發行版

「Linux」 Centos7系統介紹與安裝

01.28 為什麼說 Manjaro Linux 是最好用的 Linux

「重要」Kali Linux 使用風險提示

12.17 「重要」Kali Linux 使用風險提示

Linux Kernel 5.5 最終刪除 SYSCTL 系統調用

發行版介紹-Oracle Linux

全面介紹 Linux 權限

Linux 系統調用 API 之文件 I

linux C GDB 調試技巧

如何升級 Linux Mint 19.1 為 Linux Mint 19.2

Linux 學習筆記之，特殊權限 SUIG、SGID、SBIT

linux 課程學習第三天

02.02 監控 Linux 服務器活動的幾個命令

理解 Linux 網絡棧：Linux 網絡協議棧簡單總結

「Linux」使用tc命令增加網絡延時

09.10 介紹 Linux 中的管道和命名管道

Linux 虛擬機與 Linux Live 鏡像

Oracle Linux 系統如何去註冊使用堅不可摧 Linux 網絡（ULN）

04.23 Linux 文件與目錄管理常用命令

03.26 linux-netstat已經過時，你該用ss了！

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

Linux 下epoll 網絡模型為什麼需要epoll?

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？