偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

Linux基礎(chǔ)命令介紹八：文本分析awk

作者：vvpale 2016-12-23 10:56:34

系統(tǒng) Linux

awk是一種模式掃描和處理語言，在對(duì)數(shù)據(jù)進(jìn)行分析處理時(shí)，是十分強(qiáng)大的工具。awk的工作過程是這樣的：按行讀取輸入(標(biāo)準(zhǔn)輸入或文件)，對(duì)于符合模式pattern的行，執(zhí)行action。當(dāng)pattern省略時(shí)表示匹配任何字符串;當(dāng)action省略時(shí)表示執(zhí)行'{print}';它們不可以同時(shí)省略。

awk是一種模式掃描和處理語言，在對(duì)數(shù)據(jù)進(jìn)行分析處理時(shí)，是十分強(qiáng)大的工具。

awk [options] 'pattern {action}' file...

awk的工作過程是這樣的：按行讀取輸入(標(biāo)準(zhǔn)輸入或文件)，對(duì)于符合模式pattern的行，執(zhí)行action。當(dāng)pattern省略時(shí)表示匹配任何字符串;當(dāng)action省略時(shí)表示執(zhí)行'{print}';它們不可以同時(shí)省略。

每一行輸入，對(duì)awk來說都是一條記錄(record)，awk使用$0來引用當(dāng)前記錄：

[root@centos7 ~]# head -1 /etc/passwd | awk '{print $0}' 
root:x:0:0:root:/root:/bin/bash

例子中將命令head -1 /etc/passwd作為awk的輸入，awk省略了pattern，action為print $0，意為打印當(dāng)前記錄。

對(duì)于每條記錄，awk使用分隔符將其分割成列，***列用$1表示，第二列用$2表示...***一列用$NF表示

選項(xiàng)-F表示指定分隔符

如輸出文件/etc/passwd***行***列(用戶名)和***一列(登錄shell)：

[root@centos7 ~]# head -1 /etc/passwd | awk -F: '{print $1,$NF}' 
root /bin/bash

當(dāng)沒有指定分隔符時(shí)，使用一到多個(gè)blank(空白字符，由空格鍵或TAB鍵產(chǎn)生)作為分隔符。輸出的分隔符默認(rèn)為空格。

如輸出命令ls -l *的結(jié)果中，文件大小和文件名：

[root@centos7 temp]# ls -l * | awk '{print $5,$NF}' 
13 b.txt 
58 c.txt 
12 d.txt 
0 e.txt 
0 f.txt 
24 test.sh 
[root@centos7 temp]#

還可以對(duì)任意列進(jìn)行過濾：

[root@centos7 temp]# ls -l *|awk '$5>20 && $NF ~ /txt$/' 
-rw-r--r-- 1 nobody nobody 58 11月 16 16:34 c.txt

其中$5>20表示第五列的值大于20;&&表示邏輯與;$NF ~ /txt$/中，~表示匹配，符號(hào)//內(nèi)部是正則表達(dá)式。這里省略了action，整條awk語句表示打印文件大小大于20字節(jié)并且文件名以txt結(jié)尾的行。

awk用NR表示行號(hào)

[root@centos7 temp]# awk '/^root/ || NR==2' /etc/passwd 
root:x:0:0:root:/root:/bin/bash 
bin:x:1:1:bin:/bin:/sbin/nologin 
[root@centos7 temp]#

例子中||表示邏輯或，語句表示：輸出文件/etc/passwd中以root開頭的行或者第二行。

在一些情況下，使用awk過濾甚至比使用grep更靈活

如獲得ifconfig的輸出中網(wǎng)卡名及其對(duì)應(yīng)的mtu值

[root@idc-v-71253 ~]# ifconfig|awk '/^\S/{print $1"\t"$NF}' 
ens32:  1500 
ens33:  1500 
lo:     65536 
[root@idc-v-71253 ~]#  
#這里的正則表示不以空白字符開頭的行，輸出內(nèi)容中使用\t進(jìn)行了格式化。

#這里的正則表示不以空白字符開頭的行，輸出內(nèi)容中使用\t進(jìn)行了格式化。

以上所說的NR、NF等都是awk的內(nèi)建變量，下面列出部分常用內(nèi)置變量

$0          當(dāng)前記錄（這個(gè)變量中存放著整個(gè)行的內(nèi)容） 
$1~$n       當(dāng)前記錄的第n個(gè)字段，字段間由FS分隔 
FS          輸入字段分隔符 默認(rèn)是空格或Tab 
NF          當(dāng)前記錄中的字段個(gè)數(shù)，就是有多少列 
NR          行號(hào)，從1開始，如果有多個(gè)文件話，這個(gè)值也不斷累加。 
FNR         輸入文件行號(hào) 
RS          輸入的記錄分隔符， 默認(rèn)為換行符 
OFS         輸出字段分隔符， 默認(rèn)也是空格 
ORS         輸出的記錄分隔符，默認(rèn)為換行符 
FILENAME    當(dāng)前輸入文件的名字

awk中還可以使用自定義變量，如將網(wǎng)卡名賦值給變量a，然后輸出網(wǎng)卡名及其對(duì)應(yīng)的RX bytes的值(注意不同模式匹配及其action的寫法)：

[root@idc-v-71253 ~]# ifconfig|awk '/^\S/{a=$1}/RX p/{print a,$5}' 
ens32: 999477100 
ens33: 1663197120 
lo: 0

awk中有兩個(gè)特殊的pattern：BEGIN和END;它們不會(huì)對(duì)輸入文本進(jìn)行匹配，BEGIN對(duì)應(yīng)的action部分組合成一個(gè)代碼塊，在任何輸入開始之前執(zhí)行;END對(duì)應(yīng)的action部分組合成一個(gè)代碼塊，在所有輸入處理完成之后執(zhí)行。

#注意類似于C語言的賦值及print函數(shù)用法 
[root@centos7 temp]# ls -l *|awk 'BEGIN{print "size name\n---------"}$5>20{x+=$5;print $5,$NF}END{print "---------\ntotal",x}' 
size name 
--------- 
58 c.txt 
24 test.sh 
--------- 
total 82 
[root@centos7 temp]#

awk還支持?jǐn)?shù)組，數(shù)組的索引都被視為字符串(即關(guān)聯(lián)數(shù)組)，可以使用for循環(huán)遍歷數(shù)組元素

如輸出文件/etc/passwd中各種登錄shell及其總數(shù)量

#注意數(shù)組賦值及for循環(huán)遍歷數(shù)組的寫法 
[root@centos7 temp]# awk -F ':' '{a[$NF]++}END{for(i in a) print i,a[i]}' /etc/passwd 
/bin/sync 1 
/bin/bash 2 
/sbin/nologin 19 
/sbin/halt 1 
/sbin/shutdown 1 
[root@centos7 temp]#

當(dāng)然也有if分支語句

#注意大括號(hào)是如何界定action塊的 
[root@centos7 temp]# netstat -antp|awk '{if($6=="LISTEN"){x++}else{y++}}END{print x,y}' 
6 3 
[root@centos7 temp]#

pattern之間可以用逗號(hào)分隔，表示從匹配***個(gè)模式開始直到匹配第二個(gè)模式

[root@centos7 ~]# awk '/^root/,/^adm/' /etc/passwd        
root:x:0:0:root:/root:/bin/bash 
bin:x:1:1:bin:/bin:/sbin/nologin 
daemon:x:2:2:daemon:/sbin:/sbin/nologin 
adm:x:3:4:adm:/var/adm:/sbin/nologin

還支持三目操作符pattern1 ? pattern2 : pattern3，表示判斷pattern1是否匹配，true則匹配pattern2，false則匹配pattern3，pattern也可以是類似C語言的表達(dá)式。

如判斷文件/etc/passwd中UID大于500的登錄shell是否為/bin/bash，是則輸出整行，否則輸出UID為0的行：

#注意為避免混淆對(duì)目錄分隔符進(jìn)行了轉(zhuǎn)義 
[root@centos7 ~]# awk -F: '$3>500?/\/bin\/bash$/:$3==0 {print $0}' /etc/passwd          
root:x:0:0:root:/root:/bin/bash 
learner:x:1000:1000::/home/learner:/bin/bash 
#三目運(yùn)算符也可以嵌套，例子略

選項(xiàng)-f file表示從file中讀取awk指令

#打印斐波那契數(shù)列前十項(xiàng) 
[root@centos7 temp]# cat test.awk  
BEGIN{ 
    $1=1 
    $2=1 
    OFS="," 
    for(i=3;i<=10;i++) 
    { 
        $i=$(i-2)+$(i-1) 
    } 
    print 
} 
[root@centos7 temp]# awk -f test.awk  
1,1,2,3,5,8,13,21,34,55 
[root@centos7 temp]#

選項(xiàng)-F指定列分隔符

#多個(gè)字符作為分隔符時(shí) 
[root@centos7 temp]# echo 1.2,3:4 5|awk -F '[., :]' '{print $2,$NF}' 
2 5 
[root@centos7 temp]# 
#這里-F后單引號(hào)中的內(nèi)容也是正則表達(dá)式

選項(xiàng)-v var=val設(shè)定變量

#這里printf函數(shù)用法類似C語言同名函數(shù) 
[root@centos7 ~]# awk -v n=5 'BEGIN{for(i=0;i<n;i++) printf "%02d\n",i}'   
00 
01 
02 
03 
04 
[root@centos7 ~]#

print等函數(shù)還支持使用重定向符>和>>將輸出保存至文件

#如按***列(IP)分類拆分文件access.log，并保存至ip.txt文件中 
[root@centos7 temp]# awk '{print > $1".txt"}' access.log  
[root@centos7 temp]# ls -l 172.20.71.* 
-rw-r--r-- 1 root root 5297 11月 22 21:33 172.20.71.38.txt 
-rw-r--r-- 1 root root 1236 11月 22 21:33 172.20.71.39.txt 
-rw-r--r-- 1 root root 4533 11月 22 21:33 172.20.71.84.txt 
-rw-r--r-- 1 root root 2328 11月 22 21:33 172.20.71.85.txt

內(nèi)建函數(shù)

length()獲得字符串長度

[root@centos7 temp]# awk -F: '{if(length($1)>=16)print}' /etc/passwd  
systemd-bus-proxy:x:999:997:systemd Bus Proxy:/:/sbin/nologin 
[root@centos7 temp]#

split()將字符串按分隔符分隔，并保存至數(shù)組

[root@centos7 temp]# head -1 /etc/passwd|awk '{split($0,arr,/:/);for(i=1;i<=length(arr);i++) print arr[i]}' 
root 
x 
0 
0 
root 
/root 
/bin/bash 
[root@centos7 temp]#

getline從輸入(可以是管道、另一個(gè)文件或當(dāng)前文件的下一行)中獲得記錄，賦值給變量或重置某些環(huán)境變量

#從shell命令date中通過管道獲得當(dāng)前的小時(shí)數(shù) 
[root@centos7 temp]# awk 'BEGIN{"date"|getline;split($5,arr,/:/);print arr[1]}' 
09 
#從文件中獲取，此時(shí)會(huì)覆蓋當(dāng)前的$0。(注意逐行處理b.txt的同時(shí)也在逐行從c.txt中獲得記錄并覆蓋$0，當(dāng)getline先遇到eof時(shí)<即c.txt文件行數(shù)較少>將輸出空行) 
[root@centos7 temp]# awk '{getline <"c.txt";print $4}' b.txt  
"https://segmentfault.com/blog/learnning" 
[root@centos7 temp]#  
#賦值給變量 
[root@centos7 temp]# awk '{getline blog <"c.txt";print $0"\n"blog}' b.txt  
aasdasdadsad 
BLOG ADDRESS IS "https://segmentfault.com/blog/learnning" 
[root@centos7 temp]#  
#讀取下一行(也會(huì)覆蓋當(dāng)前$0) 
[root@centos7 temp]# cat file 
anny 
100 
bob 
150 
cindy 
120 
[root@centos7 temp]# awk '{getline;total+=$0}END{print total}' file 
370 
#此時(shí)表示只對(duì)偶數(shù)行進(jìn)行處理

next作用和getline類似，也是讀取下一行并覆蓋$0，區(qū)別是next執(zhí)行后，其后的命令不再執(zhí)行，而是讀取下一行從頭再執(zhí)行。

#跳過以a-s開頭的行，統(tǒng)計(jì)行數(shù)，打印最終結(jié)果 
[root@centos7 temp]# awk '/^[a-s]/{next}{count++}END{print count}' /etc/passwd 
2 
[root@centos7 temp]#  
#又如合并相同列的兩個(gè)文件 
[root@centos7 temp]# cat f.txt  
學(xué)號(hào) 分值 
00001 80 
00002 75 
00003 90 
[root@centos7 temp]# cat e.txt  
姓名 學(xué)號(hào) 
張三 00001 
李四 00002 
王五 00003 
[root@centos7 temp]# awk 'NR==FNR{a[$1]=$2;next}{print $0,a[$2]}' f.txt e.txt    
姓名 學(xué)號(hào) 分值 
張三 00001 80 
李四 00002 75 
王五 00003 90 
#這里當(dāng)讀***個(gè)文件時(shí)NR==FNR成立，執(zhí)行a[$1]=$2，然后next忽略后面的。讀取第二個(gè)文件時(shí)，NR==FNR不成立，執(zhí)行后面的打印命令

sub(regex,substr,string)替換字符串string(省略時(shí)為$0)中***出現(xiàn)匹配正則regex的子串substr

[root@centos7 temp]# echo 178278 world|awk 'sub(/[0-9]+/,"hello")' 
hello world 
[root@centos7 temp]#

gsub(regex,substr,string)與sub()類似，但不止替換***個(gè)，而是全局替換

[root@centos7 temp]# head -n5 /etc/passwd|awk '{gsub(/[0-9]+/,"----");print $0}'      
root:x:----:----:root:/root:/bin/bash 
bin:x:----:----:bin:/bin:/sbin/nologin 
daemon:x:----:----:daemon:/sbin:/sbin/nologin 
adm:x:----:----:adm:/var/adm:/sbin/nologin 
lp:x:----:----:lp:/var/spool/lpd:/sbin/nologin

substr(str,n,m)切割字符串str，從第n個(gè)字符開始，切割m個(gè)。如果m省略，則到結(jié)尾

[root@centos7 temp]# echo "hello,世界！"|awk '{print substr($0,8,1)}' 
界 
[root@centos7 temp]#

tolower(str)和toupper(str)表示大小寫轉(zhuǎn)換

[root@centos7 temp]# echo "hello,世界！"|awk '{A=toupper($0);print A}' 
HELLO,世界！ 
[root@centos7 temp]#

system(cmd)執(zhí)行shell命令cmd，返回執(zhí)行結(jié)果，執(zhí)行成功為0，失敗為非0

#此處if語句判斷和C語言一致，0為false，非0為true 
[root@centos7 temp]# awk 'BEGIN{if(!system("date>/dev/null"))print "success"}' 
success 
[root@centos7 temp]#

match(str,regex)返回字符串str中匹配正則regex的位置

[root@centos7 temp]# awk 'BEGIN{A=match("abc.f.11.12.1.98",/[0-9]{1,3}\./);print A}' 
7 
[root@centos7 temp]#

awk作為一個(gè)編程語言可以處理各種各樣的問題，甚至于編寫應(yīng)用軟件，但它更常用的地方是命令行下的文本分析，生成報(bào)表等，這些場(chǎng)景下awk工作的很好。工作中如經(jīng)常有文本分析的需求，那么掌握這個(gè)命令的用法將為你節(jié)省大量的時(shí)間。

責(zé)任編輯：龐桂玉來源： segmentfault

linux shell awk

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營