Linux awk 指令-PHP开发-PHP中文網

首頁

php教程

PHP开发

Linux awk 指令

高洛峰

Dec 12, 2016 pm 03:55 PM

AWK是一种处理文本文件的语言，是一个强大的文本分析工具。

之所以叫AWK是因为其取了三位创始人 Alfred Aho，Peter Weinberger, 和 Brian Kernighan 的Family Name的首字符。

语法

awk [选项参数] &#39;script&#39; var=value file(s)或awk [选项参数] -f scriptfile var=value file(s)

登入後複製

选项参数说明：

-F fs or --field-separator fs

登入後複製

指定输入文件折分隔符，fs是一个字符串或者是一个正则表达式，如-F:。

-v var=value or --asign var=value

登入後複製

赋值一个用户定义变量。

-f scripfile or --file scriptfile

登入後複製

从脚本文件中读取awk命令。

-mf nnn and -mr nnn

登入後複製

对nnn值设置内在限制，-mf选项限制分配给nnn的最大块数目；-mr选项限制记录的最大数目。这两个功能是Bell实验室版awk的扩展功能，在标准awk中不适用。

-W compact or --compat, -W traditional or --traditional

登入後複製

在兼容模式下运行awk。所以gawk的行为和标准的awk完全一样，所有的awk扩展都被忽略。

-W copyleft or --copyleft, -W copyright or --copyright

登入後複製

打印简短的版权信息。

-W help or --help, -W usage or --usage

登入後複製

打印全部awk选项和每个选项的简短说明。

-W lint or --lint

登入後複製

打印不能向传统unix平台移植的结构的警告。

-W lint-old or --lint-old

登入後複製

打印关于不能向传统unix平台移植的结构的警告。

-W posix

登入後複製

打开兼容模式。但有以下限制，不识别：/x、函数关键字、func、换码序列以及当fs是一个空格时，将新行作为一个域分隔符；操作符**和**=不能代替^和^=；fflush无效。

-W re-interval or --re-inerval

登入後複製

允许间隔正则表达式的使用，参考(grep中的Posix字符类)，如括号表达式[[:alpha:]]。

-W source program-text or --source program-text

登入後複製

使用program-text作为源代码，可与-f命令混用。

-W version or --version

登入後複製

打印bug报告信息的版本。

基本用法

log.txt文本内容如下：

2 this is a test3 Are you like awkThis's a test
10 There are orange,apple,mongo

用法一：

awk '{[pattern] action}' {filenames} # 行匹配语句 awk '' 只能用单引号

实例：

# 每行按空格或TAB分割，输出文本中的1、4项
 $ awk &#39;{print $1,$4}&#39; log.txt ---------------------------------------------
 2 a 3 like This&#39;s
 10 orange,apple,mongo
 # 格式化输出
 $ awk &#39;{printf "%-8s %-10s\n",$1,$4}&#39; log.txt
 ---------------------------------------------
 2        a
 3        like
 This&#39;s 10       orange,apple,mongo

登入後複製

用法二：

awk -F #-F相当于内置变量FS, 指定分割字符

实例：

# 使用","分割
 $  awk -F, &#39;{print $1,$2}&#39;   log.txt ---------------------------------------------
 2 this is a test 3 Are you like awk This&#39;s a test
 10 There are orange apple
 # 或者使用内建变量
 $ awk &#39;BEGIN{FS=","} {print $1,$2}&#39;     log.txt
 ---------------------------------------------
 2 this is a test
 3 Are you like awk
 This&#39;s a test 10 There are orange apple # 使用多个分隔符.先使用空格分割，然后对分割结果再使用","分割
 $ awk -F &#39;[ ,]&#39;  &#39;{print $1,$2,$5}&#39;   log.txt ---------------------------------------------
 2 this test 3 Are awk This&#39;s a
 10 There apple

登入後複製

用法三：

awk -v # 设置变量

实例：

$ awk -va=1 &#39;{print $1,$1+a}&#39; log.txt ---------------------------------------------
 2 3
 3 4
 This&#39;s 1
 10 11
 $ awk -va=1 -vb=s &#39;{print $1,$1+a,$1b}&#39; log.txt
 ---------------------------------------------
 2 3 2s
 3 4 3s
 This&#39;s 1 This&#39;ss
 10 11 10s

登入後複製

用法四：

awk -f {awk脚本} {文件名}

登入後複製

实例：

$ awk -f cal.awk log.txt

登入後複製

Linux awk 指令

过滤第一列大于2的行

$ awk &#39;$1>2&#39; log.txt   
#命令#输出
3 Are you like awkThis&#39;s a test
10 There are orange,apple,mongo

登入後複製

过滤第一列等于2的行

$ awk &#39;$1==2 {print $1,$3}&#39; log.txt    #命令
#输出
2 is

登入後複製

过滤第一列大于2并且第二列等于'Are'的行

$ awk &#39;$1>2 && $2=="Are" {print $1,$2,$3}&#39; log.txt    #命令
#输出
3 Are you

登入後複製

内建变量

$ awk &#39;BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}&#39;  log.txt
FILENAME ARGC  FNR   FS   NF   NR  OFS  ORS   RS
---------------------------------------------
log.txt    2    1         5    1
log.txt    2    2         5    2
log.txt    2    3         3    3
log.txt    2    4         4    4
$ awk -F\&#39; &#39;BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}&#39;  log.txt
FILENAME ARGC  FNR   FS   NF   NR  OFS  ORS   RS
---------------------------------------------
log.txt    2    1    &#39;    1    1
log.txt    2    2    &#39;    1    2
log.txt    2    3    &#39;    2    3
log.txt    2    4    &#39;    1    4
# 输出顺序号 NR, 匹配文本行号
$ awk &#39;{print NR,FNR,$1,$2,$3}&#39; log.txt
---------------------------------------------
1 1 2 this is
2 2 3 Are you
3 3 This&#39;s a test
4 4 10 There are
# 指定输出分割符
$  awk &#39;{print $1,$2,$5}&#39; OFS=" $ "  log.txt
---------------------------------------------
2 $ this $ test
3 $ Are $ awk
This&#39;s $ a $
10 $ There $

登入後複製

使用正则，字符串匹配

# 输出第二列包含 "th"，并打印第二列与第四列
$ awk &#39;$2 ~ /th/ {print $2,$4}&#39; log.txt
---------------------------------------------
this a

登入後複製

~ 表示模式开始。// 中是模式。

$ awk &#39;BEGIN{IGNORECASE=1} /this/&#39; log.txt
---------------------------------------------
2 this is a test
This&#39;s a test

登入後複製

模式取反

$ awk &#39;$2 !~ /th/ {print $2,$4}&#39; log.txt
---------------------------------------------
Are like
a
There orange,apple,mongo
$ awk &#39;!/th/ {print $2,$4}&#39; log.txt
---------------------------------------------
Are like
a
There orange,apple,mongo

登入後複製

awk脚本

关于awk脚本，我们需要注意两个关键词BEGIN和END。

BEGIN{ 这里面放的是执行前的语句 }

END {这里面放的是处理完所有的行后要执行的语句 }

{这里面放的是处理每一行时要执行的语句}

假设有这么一个文件（学生成绩表）：

$ cat score.txt
Marry   2143 78 84 77
Jack    2321 66 78 45
Tom     2122 48 77 71
Mike    2537 87 97 95
Bob     2415 40 57 62

登入後複製

我们的awk脚本如下：

$ cat cal.awk
#!/bin/awk -f
#运行前
BEGIN {
    math = 0
    english = 0
    computer = 0
 
    printf "NAME    NO.   MATH  ENGLISH  COMPUTER   TOTAL\n"
    printf "---------------------------------------------\n"
}
#运行中
{
    math+=$3
    english+=$4
    computer+=$5
    printf "%-6s %-6s %4d %8d %8d %8d\n", $1, $2, $3,$4,$5, $3+$4+$5
}
#运行后
END {
    printf "---------------------------------------------\n"
    printf "  TOTAL:%10d %8d %8d \n", math, english, computer
    printf "AVERAGE:%10.2f %8.2f %8.2f\n", math/NR, english/NR, computer/NR
}

登入後複製

我们来看一下执行结果：

$ awk -f cal.awk score.txt
NAME    NO.   MATH  ENGLISH  COMPUTER   TOTAL
---------------------------------------------
Marry  2143     78       84       77      239
Jack   2321     66       78       45      189
Tom    2122     48       77       71      196
Mike   2537     87       97       95      279
Bob    2415     40       57       62      159
---------------------------------------------
  TOTAL:       319      393      350
AVERAGE:     63.80    78.60    70.00

登入後複製

另外一些实例

AWK的hello world程序为：

BEGIN { print "Hello, world!" }

登入後複製

计算文件大小

$ ls -l *.txt | awk &#39;{sum+=$6} END {print sum}&#39;
--------------------------------------------------
666581

登入後複製

从文件中找出长度大于80的行

awk &#39;lenght>80&#39; log.txt

登入後複製

打印九九乘法表

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Linux awk 指令

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題