grep 是一種強大的文本搜尋工具,它能使用正規表示式搜尋文本,並將符合的行列印出來。以下透過本文跟大家分享Linux grep與正規表示式的相關知識,有興趣的朋友一起看看吧
grep簡介
grep 是一種強大的文本搜尋工具,它能使用正規表示式搜尋文本,並將符合的行列印出來。通常grep有三個版本grep、egrep(等同於grep -E)和fgrep。 egrep為擴充的grep,fgrep則為快速grep(固定的字串來對文字進行搜索,不支援正規表示式的引用但是查詢極為快速)。 grep是Linux文字處理三劍客之一。
grep使用方式
使用方式:
grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
常用選項:
--color=auto:對匹配到的文字著色後進行高亮顯示;
-i:忽略字元的大小寫
-o:僅顯示符合的字串
-v:顯示不能被模式比對的行
-E:支援使用擴充的正規表示式
-q:靜默模式,即不輸出任何訊息
-A #:顯示被模式匹配的行及其後#行
-B #:顯示被模式相符的行及其前#行
-C #:顯示被模式匹配的行及其前後各#行
註:使用grep匹配時需使用雙引號引起來(單引號為強引用),防止被系統誤認為參數或特殊指令而報錯。
擴充grep使用方式
使用方式:
egrep [OPTIONS] PATTERN [FILE...] grep -E [OPTIONS] PATTERN [FILE...]
-i:忽略字元的大小寫
-o:僅顯示符合的字串本身
-v:顯示不被模式匹配到的行
-q:靜默模式,即不輸出任何資訊
-A #:顯示被模式匹配的行及其後#行
-B #:顯示被模式匹配的行及其前#行
-C #:顯示被模式匹配的行及其前後各#行
-G:支援基本正規表示式
grep正規表示式元字元
'^':錨定行首
'$': 錨定行尾
'.': 符合任一一個字元
'*': 符合零個或多個先前字元
'\?':匹配其前面的字元0次或1次;
'\+':符合其前面的字元1次或多次;
' \{m\}':符合其前面的字元m次(\為轉義字元)
'\{m,n\}':符合其前面的字元至少m次,至多n次
'[]': 符合指定範圍內的字元| '[^]'符合指定範圍外的任意單一字元
'\<'或'\b':錨定詞首,'\>'或'\b':錨定詞尾(可用\
'\(\)':將多個字元當做一個整體進行處理
後向引用:引用前面的分組括號中的模式所匹配到的字元
分組括號中的模式匹配到的內容或被正則表達式引擎自動記錄於內部的變數中:
\1:模式從左側起,第一個左括號及與之匹配的右括號之間模式匹配到的內容
\2:模式從左側起,第二個左括號及與之匹配的右括號之間模式匹配到的內容...
擴展正則表達式與正則表達式略有不同:
'[]':依舊符合指定範圍內的任意單一字元;但是有許多特殊符合方式。
[:digit:] 符合任何單一數字
[:lower:] 符合任單小寫字母
[:alpha:] 比對任一字母 [:alnum:] 符合任一字母或數字 [:punct:] 符合任意單字或數字 [:punct:] 符合任意單一符號[:space:] 符合單一空格
一些地方取消了轉義字元的使用:
'?':符合其前面的字元0次或1次;
'+':符合其前面的字元1次或多次;
'{m}':將其前面的字元 m次(\為轉義字元)
'{ m,n}':符合其前面的字元至少m次,至多n次
():將一個或多個字元捆綁在一起,當做一個整體進行處理,反向引用照常使用。
'|':或(註:'C|cat'為C與cat,'(C|c)at才是Cat與cat')
練習題: 1、列出目前系統上所有已登入的使用者的使用者名,注意:同一個使用者登入多次,則只顯示一次
[root@localhost ~]# who | cut -d' ' -f1|uniq root
2、取出最后登录到当前系统的用户的相关信息
[root@localhost ~]# id `last | head -1 | cut -d' ' -f1` uid=0(root) gid=0(root) groups=0(root)
3.取出当前系统上被用户当做其默认shell最多的那个shell
[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7 /sbin/nologin
4.将/etc/passd中的第三个字段设置最大的后10个用户的信息全部改为大写保存至/tmp/maxuser.txt文件中
[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt [root@localhost ~]# cat /tmp/maxusers.txt NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH EGON:X:1002:1002::/HOME/EGON:/BIN/BASH NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN
5.取出当前主机的IP地址
[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10 192.168.0.133
6.列出/etc目录下所有已.conf结尾的文件的文件名,并将其名字转换为大写后保存至/tmp/etc.conf文件中
[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf [root@localhost ~]# cat /tmp/etc.conf RESOLV.CONF CA-LEGACY.CONF FASTESTMIRROR.CONF LANGPACKS.CONF SYSTEMD.CONF VERSION-GROUPS.CONF LVM.CONF LVMLOCAL.CONF ASOUND.CONF LDAP.CONF MLX4.CONF RDMA.CONF SMTPD.CONF
7.显示/var目录下一级子目录或文件的总数
[root@localhost ~]# ls /var | wc -l
8.取出/etc/group第三个字段数值最小的10个组的名字
[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1 root bin daemon sys adm tty disk lp mem kmem
9.将/etc/fstab和/etc/issue文件的内容合并为同一个内容后保存至/tmp/etc.test文件中
[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test [root@localhost ~]# cat /tmp/etc.test # # /etc/fstab # Created by anaconda on Sat May 13 10:12:58 2017 # # Accessible filesystems, by reference, are maintained under '/dev/disk' # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info # /dev/mapper/cl-root / xfs defaults 0 0 UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot xfs defaults 0 0 /dev/mapper/cl-swap swap swap defaults 0 0 \S Kernel \r on an \m
以上是Linux grep與正規表示式的簡單介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!