리눅스 awk 명령을 사용하는 방법-리눅스 운영 및 유지 관리-php.cn

Linux에서 awk 명령은 텍스트 파일 형식을 지정하고 텍스트 파일의 보다 복잡한 처리 및 분석을 수행하는 데 적합한 텍스트 데이터 처리 도구입니다. 구문은 "awk [옵션] '패턴[액션]' 파일..."입니다. . Awk에는 강력한 텍스트 형식 지정 기능이 있습니다. 예를 들어, 불규칙해 보이는 로그 파일, 텍스트 파일 등의 경우 awk 명령을 전달한 후 형식화된 출력은 애플리케이션 수준 데이터 분석에 사용할 수 있는 전문적인 스타일이 됩니다.

리눅스 awk 명령을 사용하는 방법

이 튜토리얼의 운영 환경: linux7.3 시스템, Dell G3 컴퓨터.

Linux 시스템에는 awk라는 더 강력한 텍스트 데이터 처리 도구가 있습니다. 이는 1970년대 후반에 탄생했는데, 이것이 많은 Linux 사용자에게 영향을 미친 이유 중 하나일 수 있습니다.

어떤 사람들은 awk 명령의 이름이 어색한 단어에서 유래했다고 추측했습니다. 실제로는 그렇지 않습니다. 이 명령의 설계자는 3명이며, 그들의 성은 마스터 성의 첫 글자인 Aho, Weingberger 및 Kernighan입니다.

awk에는 강력한 텍스트 형식 지정 기능이 있습니다. 예를 들어 불규칙해 보이는 로그 파일, 텍스트 파일 등의 경우 awk 명령을 전달한 후 형식화된 출력은 애플리케이션 수준에서 사용할 수 있는 전문적인 스타일이 됩니다.

awk는 조건부 판단, 배열, 루프 및 기타 여러 기능을 지원하는 프로그래밍 언어와 같습니다.

linux 삼총사

grep은 단순히 텍스트 콘텐츠를 찾거나 일치시키는 데 능숙합니다. sed, 텍스트 편집에 능숙하고 일치하는 텍스트 콘텐츠를 처리합니다.
awk, 텍스트 파일 형식 지정에 적합하고 텍스트 파일의 더 복잡한 처리 및 분석을 수행합니다.
awk 이론적 기반

1, awk Syntax

awk  [option]  &#39;pattern[action]&#39;  file ...

awk   参数       条件动作           文件

로그인 후 복사

action은 텍스트 형식 지정에 능숙하고 형식화된 결과를 출력할 수 있으므로 가장 일반적으로 사용되는 작업은 printf 리눅스 awk 명령을 사용하는 방법

2입니다.
awk는 기본적으로 공백을 구분자로 사용하며 여러 공백도 구분자로 하나의 공백으로 인식합니다.

awk는 파일을 한 줄씩 처리하고 한 줄을 처리한 후 awk를 처리할 수 있습니다. 사용자가 지정합니다. 지정하지 않으면 기본적으로 공백이 사용됩니다.

내장 변수

설명

$n구분 기호 지정 후 현재 n번째 열이 위치한 필드$0레코드의 전체 행FS필드 구분 기호, 기본값은 공백NF(필드 수)필드가 분리된 후 현재 NR(레코드 수)은 몇 개입니까?

更多的内置变量，可通过 man awk命令进行查看

简单案例展示

提前准备一个文本，内容如下

리눅스 awk 명령을 사용하는 방법

1、输出第二列内容

awk &#39;{print $2}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

2、输出多列内容

直接在第一步后面的基础上追加，中间用 “,” 分割

awk &#39;{print $2,$3}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

3、查看第三行内容

考察对NR的使用，NR表示第N行记录的模式匹配

awk &#39;NR==3{print $0}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

输出多行

awk &#39;NR==5,NR==6{print $0}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

4、输出从第3到第五行，并显示行号

awk &#39;NR==3,NR==5 {print NR,$0}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

5、自定义输出内容

某些情况下，需要给每一列添加类似于excel的表头信息，就可以考虑使用awk的自定义输出；

awk &#39;{print "第一列: "$1,"第二列: "$2}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

需要注意的是大括号外面的使用 ’ 单引号，括号里面的使用双引号

二、awk参数

参数	说明
-F	指定分隔字段符
-v	定义或修改一个awk内部变量
-f	从脚本文件中读取awk命令

上文谈到，awk默认的字段分隔符为空格，但是像下面这样的文本，以 # 为分隔符，就需要用到自定义分隔符；

리눅스 awk 명령을 사용하는 방법

1、显示第一列和第二列内容

awk -F "#" &#39;{print $1,$2}&#39; zcy2.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

2、显示文件第一列，倒是第一列，和倒数第二列的内容

awk &#39;{print $1,$(NF-1),$(NF-2)}&#39; alx.txt

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

3、取出本机的IP地址

1리눅스 awk 명령을 사용하는 방법

使用awk的方式获取的话，如果以空格为分隔符，我们发现目标字段在第二行的第二列，使用下面的命令即可，看起来，比起sed和grep命令似乎更简单；

ifconfig eth0 | awk &#39;NR==2{print $2}&#39;

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

4、取出密码文件中的第一列和最后一列

考察对自定义输入分隔符的使用，可以看到，下面的文本文件中，可以考虑使用：进行分割；

1리눅스 awk 명령을 사용하는 방법

awk -F &#39;:&#39; &#39;{print $1,$NF}&#39; pwd2.txt

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

三、OFS输出分隔符

通过上文的学习，我们知道awk命令执行后，默认采用空格分割字段，而这个空格就是默认的输出分割符，

单在某些情况下，为了将数据展示的效果更加醒目一些，就可以使用OFS的自定义输出分隔符；

仍然以上面的密码文本为例，输出第一列和最后一列的字段；

awk -F &#39;:&#39; -v OFS=&#39; *** &#39; &#39;{print $1,$NF}&#39; pwd2.txt

로그인 후 복사

该表默认输出分隔符，直接在awk后面使用: -v OFS=‘自定义输出分隔符’

1리눅스 awk 명령을 사용하는 방법

四、awk变量

awk参数

参数	说明
-F	指定分隔字段符
-v	定义或修改一个awk内部变量
-f	从脚本文件中读取awk命令

对于awk来讲，变量分为：内置变量和自定义变量

awk内置变量

参数	说明
FS	输入字段分隔符，默认为空白字符
OFS	输出字段分隔符，默认为空白字符
RS	输入记录分隔符，指定输入时的换行符
ORS	输出记录分隔符，输出时用指定符号替换换行符
NF	当前行的字段个数，字段数量
NR	行号，当前处理文本行的行号
FNR	各文件分别计数的行号
FILENAME	当前文件名
ARGC	命令行参数个数
ARGV	数组，保存的是命令行所给定的各个参数

比较常用的内置变量包括： NR,NF，FNR

FILENAME 使用

FILENAME 为awk的内置变量，通过下面这个命令，可以看到在每行记录之前，输出了当前文件名称；

awk &#39;NR==1,NR==3{print FILENAME,$0}&#39; alx.txt

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

ARGV使用

先来看下面这条命令的执行结果

awk &#39;NR==1,NR==3{print ARGV[0],ARGV[1],$0}&#39; alx.txt

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

可以发现，在输出的每一行记录前面，拼上了 awk 和 alx.txt这两个字段，这两个字段就是这行命令整体解析出来的2个内置参数；

自定义变量

看下面这条命令输出效果，通过-v参数，可以自定义变量进行参数传递；

awk -v myname="zcy" &#39;BEGIN{print "我的名字是?" ,myname}&#39;

로그인 후 복사

1리눅스 awk 명령을 사용하는 방법

五、awk格式化输出

在上文，我们接触的是awk的输出功能，主要使用了 print 这个进行输出，它只能对文本进行简单的输出，但是并不能美化或者修改输出格式；

printf 格式化输出

如果对C语言有过了解的同学，对printf 并不陌生，使用这个命令（函数）可以对文本进行格式化输出；

printf与print的几点区别

printf 需要指定format；
format 用于指定后面的每个 item输出格式；
printf 语句不会自动打印换行符； \n ； print 默认添加换行符；

如下，假如我们直接使用 printf 这样操作，看下效果

awk &#39;{printf $0}&#39; alx.txt

로그인 후 복사

리눅스 awk 명령을 사용하는 방법

明显来说，把所有内容都输出到同一行了，这时候，就需要使用 printf的格式化输出来控制；

awk &#39;{printf "%s\n", $0}&#39; alx.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

再看一个案例，使用 printf 将文本中的每一列添加前置输出

awk &#39;{printf "第一列：%s   第二列：%s   第三列：%s\n" ,$1,$2,$3}&#39; alx.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

六、awk模式pattern

上文了解到，awk的语法如下：

awk [option] ‘pattern[action]’ file …

而且我们了解到,awk是按行处理文本，以上都是关于 print 相关，接下来，聊聊pattern相关的内容；

在pattern中，有个比较常见的pattern，BEGIN和END；

BEGIN 模式是处理文本之前需要执行的动作；
END模式是处理完成所有的行之后执行的操作；

awk &#39;BEGIN{print "小明在学linux"}&#39;

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

或者下面这样

awk &#39;BEGIN{print "小明在学linux"} {print $0}END{print "处理结束"}&#39; alx.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

注意：BEGIN 和 END分别放到处理文本内容前后即可

awk如果不指定模式是按行处理，如果指定了模式，只有符合模式的才会被处理

awk常用模式

关系运算符	说明
<	小于
<=	小于等于
==	等于
!=	不等于
>=	大于等于
~	匹配正则
!~	不匹配正则

1、打印前三行的文本内容

awk &#39;NR<=3{print $0}&#39; alx.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

2、匹配密码文本中含有 zcy 的行

awk &#39;/^zcy/{print $0}&#39; pwd.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

3、格式化输出 /etc/passwd 的部分字段

awk -F ":" &#39;BEGIN{print"用户名\t\t\t字段1\t\t     字段2\t\t     权限"} {printf "user:%-20s%-20s%-20s%-20s\n", $1,$4,$5,$7}&#39; pwd.txt

로그인 후 복사

4、找出pwd文件中nologin的用户

2리눅스 awk 명령을 사용하는 방법

awk &#39;/\/sbin\/nologin$/{print NR,$0}&#39; pwd.txt

로그인 후 복사

2리눅스 awk 명령을 사용하는 방법

5、找出下面这个区间的文本行

리눅스 awk 명령을 사용하는 방법

awk &#39;/^daemon/,/^operator/{print NR,$0}&#39; pwd.txt

로그인 후 복사

3리눅스 awk 명령을 사용하는 방법