84669 人學習
152542 人學習
20005 人學習
5487 人學習
7821 人學習
359900 人學習
3350 人學習
180660 人學習
48569 人學習
18603 人學習
40936 人學習
1549 人學習
1183 人學習
32909 人學習
想写一个python分析统计apache 网站日志文件并将统计后的数据存入mysql中的的脚本,有没有参考的,没有思路主要是统计 哪些url被爬取了 及 被爬取次数,以及IP这两个
认证0级讲师
先把原始資料 規整化,然後 key 值自己定,再用 collections 的 Counter 統計,再遍歷寫入 db, 大概程式碼如下:
data = ['/a 1.2.1.2', '/b 2.2.2.2', '/c 1.1.1.1', '/d 2.2.2.2', '/d 2.2.2.2'] from collections import Counter c = Counter(data) print c
Counter({'/d 2.2.2.2': 2, '/b 2.2.2.2': 1, '/a 1.2.1.2': 1, '/c 1.1.1.1': 1})
你也可以自己維護字典,鍵為:/PATH:IP 或者什麼,自己定,然後一邊遍歷,一邊添加就好了
/PATH:IP
先把原始資料 規整化,然後 key 值自己定,再用 collections 的 Counter 統計,再遍歷寫入 db, 大概程式碼如下:
你也可以自己維護字典,鍵為:
/PATH:IP
或者什麼,自己定,然後一邊遍歷,一邊添加就好了