cat access.2012010.log
cat access.20120104.log | awk '{a[$1]} END {for(b in a) print b\ta[b]}' | sort -k2 -r | head -n 5 [jifeng@jifeng01 hadoop]$ cat access.20120104.log | awk {a[$1]++} END {for(b in a) print b\ta[b]} | sort -k2 -r | head -n 5 210.51.237.245 99
cat access.20120104.log | awk '{a[$1]++} END {for(b in a) print b"\t"a[b]}' | sort -k2 -r | head -n 5
[jifeng@jifeng01 hadoop]$ cat access.20120104.log | awk '{a[$1]++} END {for(b in a) print b"\t"a[b]}' | sort -k2 -r | head -n 5 210.51.237.245 998 180.168.213.182 995 124.205.50.21 994 192.250.46.129 993 211.94.163.244 991
对于awk 'a[$1]++',需要了解3个知识点
1、awk数组知识
2、awk的基本命令格式 awk 'pattern{action}'
省略action时,默认action是{print},如awk '1'就是awk '1{print}'
3、var++的形式:先读取var变量值,再对var值+1
最后实现的效果就是去除$1重复的行,并计算次数
等同于这个 awk '{a[$1]++} {print $1"->"a[$1]} ' access.20120104.log
access.20120104.log太多,只显示前面10条,测试下
[jifeng@jifeng01 hadoop]$ awk 'NR==1,NR==10 {print $0}' access.20120104.log >acc.txt [jifeng@jifeng01 hadoop]$ awk '{a[$1]++} {print $1"->"a[$1]} ' acc.txt 120.197.87.216->1 123.126.50.73->1 203.208.60.187->1 114.112.141.6->1 114.112.141.6->2 110.6.179.88->1 116.205.130.2->1 114.112.141.6->3 114.112.141.6->4 110.75.173.35->1
2.{for(b in a) print b"\t"a[b]}
取出数组中的下标 b,也就是IP地址和a[b]它的个数
数组的使用
建立数组
- array[index] = value :数组名array,下标index以及相应的值value。
-
{ for (item in array) print array[item]} # 输出的顺序是随机的
- {for(i=1;i
-
awk 'BEGIN{SUBSEP=":";array["a","b"]=1;for(i in array) print i}'
-
a:b
-
awk 'BEGIN{array["a"":""b"]=1;for(i in array) print i}'
- a:b
-k来指定列数
-t选项,后面可以设定间隔符
-n选项,要以数值来排序
-r选项
sort默认的排序方式是升序,如果想改成降序,就加个-r
-u选项,就是在输出行中去除重复行
4:head
head [参数]... [文件]...
命令参数:
-q 隐藏文件名
-v 显示文件名
-c 显示字节数
-n 显示的行数

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、MySQLのAlter Tableステートメントを使用して、列の追加/ドロップ、テーブル/列の名前の変更、列データ型の変更など、テーブルを変更することについて説明します。

記事では、証明書の生成と検証を含むMySQL用のSSL/TLS暗号化の構成について説明します。主な問題は、セルフ署名証明書のセキュリティへの影響を使用することです。[文字カウント:159]

記事では、MySQLで大規模なデータセットを処理するための戦略について説明します。これには、パーティション化、シャード、インデックス作成、クエリ最適化などがあります。

記事では、MySQLワークベンチやPHPMyAdminなどの人気のあるMySQL GUIツールについて説明し、初心者と上級ユーザーの機能と適合性を比較します。[159文字]

この記事では、ドロップテーブルステートメントを使用してMySQLのドロップテーブルについて説明し、予防策とリスクを強調しています。これは、バックアップなしでアクションが不可逆的であることを強調し、回復方法と潜在的な生産環境の危険を詳述しています。

INNODBのフルテキスト検索機能は非常に強力であり、データベースクエリの効率と大量のテキストデータを処理する能力を大幅に改善できます。 1)INNODBは、倒立インデックスを介してフルテキスト検索を実装し、基本的および高度な検索クエリをサポートします。 2)一致を使用してキーワードを使用して、ブールモードとフレーズ検索を検索、サポートします。 3)最適化方法には、単語セグメンテーションテクノロジーの使用、インデックスの定期的な再構築、およびパフォーマンスと精度を改善するためのキャッシュサイズの調整が含まれます。

記事では、外部キーを使用してデータベース内の関係を表すことで、ベストプラクティス、データの完全性、および避けるべき一般的な落とし穴に焦点を当てています。

この記事では、クエリパフォーマンスを強化するために、PostgreSQL、MySQL、MongoDBなどのさまざまなデータベースでJSON列にインデックスの作成について説明します。特定のJSONパスのインデックス作成の構文と利点を説明し、サポートされているデータベースシステムをリストします。
