Python - 正規表現を使用して抽出された IP に名前を付ける方法
仅有的幸福
仅有的幸福 2017-05-18 11:00:19
0
4
731
リーリー

上記のコードを通じて Apache ログ IP を抽出し、統計的重複排除を実行します。
抽出された IP データは次のとおりです:

これらの IP アドレスに名前を付けて分類する方法について説明します。
たとえば、
202.108.11.103 と 220.181.32.137 は Baidu Spider IP です。
達成したい効果は次のとおりです。
この 2 つは、 IP には Baidu Spider という名前が付けられ、それらの統計を合計すると、4336 3411
Baidu Spider 7747

となります。 ###これを行う方法###
仅有的幸福
仅有的幸福

全員に返信(4)
仅有的幸福

リーリー

いいねを押す +0
黄舟

キーとして辞書、値としてクローラー名を使用して大規模な辞書を構築してみることができます。

リーリー
いいねを押す +0
滿天的星座

パンダを使ったピボットテーブル

いいねを押す +0
阿神

なんて疲れるのでしょう!
この IP グループに IPGroup (id, ip, groupname) という名前の別のテーブルを作成してみてはいかがでしょうか

ID IP グループ名
1 202.108.11.103 百度スパイダー
2 220.181.32.137 百度スパイダー

その後は、たった 1 つの SQL で実行できます。とても簡単です (投稿者には IPStastics を使用させます)

リーリー
いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート