linux基礎(chǔ)命令介紹五:文本過濾 grep
在linux中經(jīng)常需要對文本或輸出內(nèi)容進(jìn)行過濾,最常用的過濾命令是grep
- grep [OPTIONS] PATTERN [FILE...]
grep按行檢索輸入的每一行,如果輸入行包含模式PATTERN,則輸出這一行。這里的PATTERN是正則表達(dá)式(參考前一篇,本文將結(jié)合grep一同舉例)。
輸出文件/etc/passwd中包含root的行:
- [root@centos7 temp]# grep root /etc/passwd
- root:x:0:0:root:/root:/bin/bash
- operator:x:11:0:operator:/root:/sbin/nologin
或者從標(biāo)準(zhǔn)輸入獲得:
- [root@centos7 temp]# cat /etc/passwd | grep root
- root:x:0:0:root:/root:/bin/bash
- operator:x:11:0:operator:/root:/sbin/nologin
需要注意的地方是:當(dāng)grep的輸入既來自文件也來自標(biāo)準(zhǔn)輸入時(shí),grep將忽略標(biāo)準(zhǔn)輸入的內(nèi)容不做處理,除非使用符號-來代表標(biāo)準(zhǔn)輸入:
- [root@centos7 temp]# cat /etc/passwd | grep root /etc/passwd -
- /etc/passwd:root:x:0:0:root:/root:/bin/bash
- /etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
- (標(biāo)準(zhǔn)輸入):root:x:0:0:root:/root:/bin/bash
- (標(biāo)準(zhǔn)輸入):operator:x:11:0:operator:/root:/sbin/nologin
此時(shí),grep會標(biāo)明哪些結(jié)果來自于文件哪些來自于標(biāo)準(zhǔn)輸入。
輸出文件/etc/passwd和文件/etc/group中以root開頭的行:
- [root@centos7 temp]# grep "^root" /etc/passwd /etc/group
- /etc/passwd:root:x:0:0:root:/root:/bin/bash
- /etc/group:root:x:0:
輸出文件/etc/passwd中以/bin/bash結(jié)尾的行:
- [root@centos7 temp]# grep "/bin/bash$" /etc/passwd
- root:x:0:0:root:/root:/bin/bash
- learner:x:1000:1000::/home/learner:/bin/bash
注意以上兩個(gè)例子中PATTERN被雙引號引用起來以防止被shell解析。
輸出文件/etc/passwd中不以a-s中任何一個(gè)字母開頭的行:
- [root@centos7 temp]# grep "^[^a-s]" /etc/passwd
- tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
- tcpdump:x:72:72::/:/sbin/nologin
這里需要理解兩個(gè)^間不同的含義,***個(gè)^表示行首,第二個(gè)在[]內(nèi)部的***字符^表示取反。
輸出文件/etc/passwd中字符0連續(xù)出現(xiàn)3次及以上的行(注意轉(zhuǎn)義字符'\'):
- [root@centos7 temp]# grep "0\{3,\}" /etc/passwd
- learner:x:1000:1000::/home/learner:/bin/bash
如輸出文件/etc/passwd中以字符r或l開頭的行:
- [root@centos7 temp]# grep "^[r,l]" /etc/passwd
- root:x:0:0:root:/root:/bin/bash
- lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
- learner:x:1000:1000::/home/learner:/bin/bash
選項(xiàng)-i使grep在匹配模式時(shí)忽略大小寫:
- [root@centos7 temp]# grep -i abcd file
- ABCD
- function abcd() {
- [root@centos7 temp]#
選項(xiàng)-o表示只輸出匹配的字符,而不是整行:
- [root@centos7 temp]# grep -oi abcd file
- ABCD
- abcd
- [root@centos7 temp]#
選項(xiàng)-c統(tǒng)計(jì)匹配的行數(shù):
- [root@centos7 temp]# grep -oic abcd file
- 2
- [root@centos7 temp]#
選項(xiàng)-v表示取反匹配,如輸出/etc/passwd中不以/sbin/nologin結(jié)尾的行:
- [root@centos7 temp]# grep -v "/sbin/nologin$" /etc/passwd
- root:x:0:0:root:/root:/bin/bash
- sync:x:5:0:sync:/sbin:/bin/sync
- shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
- halt:x:7:0:halt:/sbin:/sbin/halt
- learner:x:1000:1000::/home/learner:/bin/bash
選項(xiàng)-f FILE表示以文件FILE中的每一行作為模式匹配:
- [root@centos7 temp]# cat test
- abcd
- ABCD
- [root@centos7 temp]# grep -f test file
- ABCD
- function abcd() {
- [root@centos7 temp]#
選項(xiàng)-x表示整行匹配:
- [root@centos7 temp]# grep -xf test file
- ABCD
- [root@centos7 temp]#
選項(xiàng)-w表示匹配整個(gè)單詞:
- [root@centos7 temp]# grep here file
- here
- there
- [root@centos7 temp]# grep -w here file
- here
- [root@centos7 temp]#
選項(xiàng)-h表示當(dāng)多個(gè)文件時(shí)不輸出文件名:
- [root@centos7 temp]# cat /etc/passwd|grep ^root - /etc/passwd -h
- root:x:0:0:root:/root:/bin/bash
- root:x:0:0:root:/root:/bin/bash
選項(xiàng)-n表示顯示行號:
- [root@centos7 temp]# grep -n "^[r,l]" /etc/passwd
- 1:root:x:0:0:root:/root:/bin/bash
- 5:lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
- 24:learner:x:1000:1000::/home/learner:/bin/bash
選項(xiàng)-A N、-B N、-C N表示輸出匹配行和其'周圍行'
- -A N 表示輸出匹配行和其之后(after)的N行
- -B N 表示輸出匹配行和其之前(before)的N行
- -C N 表示輸出匹配行和其之前之后各N行
- [root@centos7 temp]# grep -A 2 ^operator /etc/passwd
- operator:x:11:0:operator:/root:/sbin/nologin
- games:x:12:100:games:/usr/games:/sbin/nologin
- ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
- [root@centos7 temp]# grep -B2 ^operator /etc/passwd
- halt:x:7:0:halt:/sbin:/sbin/halt
- mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
- operator:x:11:0:operator:/root:/sbin/nologin
- [root@centos7 temp]# grep -C1 ^operator /etc/passwd
- mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
- operator:x:11:0:operator:/root:/sbin/nologin
- games:x:12:100:games:/usr/games:/sbin/nologin
選項(xiàng)-F視PATTERN為它的字面意思匹配(忽略字符的特殊含義),等同于執(zhí)行命令fgrep:
- [root@centos7 temp]# grep -F ^root /etc/passwd
- [root@centos7 temp]#
命令無輸出
選項(xiàng)-E可以使用擴(kuò)展的正則表達(dá)式,如同執(zhí)行egrep命令:
- [root@centos7 temp]# egrep "^root|^learner" /etc/passwd
- root:x:0:0:root:/root:/bin/bash
- learner:x:1000:1000::/home/learner:/bin/bash
使用擴(kuò)展正則表達(dá)式意味著不需要轉(zhuǎn)義就能表示字符的特殊含義,包括?,+,{,|,(和)。
選項(xiàng)-P表示使用perl的正則表達(dá)式進(jìn)行匹配
如:
- [root@centos7 ~]# echo "helloworld123456"| grep -oP "\d+"
- 123456
- [root@centos7 ~]#
perl正則中"\d"表示數(shù)字,+表示匹配一到多次(同vim)。
選項(xiàng)-a將二進(jìn)制文件當(dāng)成文本文件處理:
- [root@centos7 ~]# grep -a online /usr/bin/ls
- %s online help: <%s>
- [root@centos7 ~]#
選項(xiàng)--exclude=GLOB和--include=GLOB分別表示排除和包含匹配GLOB的文件,GLOB表示通配符(find及xargs用法見基礎(chǔ)命令介紹三):
- [root@centos7 temp]# find . -type f | xargs grep --exclude=*.txt --include=test* bash
- ./test.sh:#!/bin/bash
- [root@centos7 temp]#
grep強(qiáng)大的過濾能力來自于各種選項(xiàng)以及正則表達(dá)式的配合,在今后的文章中還有更多的例子。