python+pandas分析nginx日誌的實例-Python教學-PHP中文網

首頁

後端開發

Python教學

python+pandas分析nginx日誌的實例

不言

Apr 28, 2018 pm 03:37 PM

nginx 紀錄

下面為大家分享一篇python pandas分析nginx日誌的實例，具有很好的參考價值，希望對大家有幫助。一起來看看吧

需求

透過分析nginx存取日誌，取得每個介面回應時間最大值、最小值、平均值及訪問量。

實作原理

將nginx日誌uriuriupstream_response_time欄位存放到pandas的dataframe中，然後透過分組、資料統計功能實作。

實作

1.準備工作

#创建日志目录，用于存放日志
mkdir /home/test/python/log/log
#创建文件，用于存放从nginx日志中提取的$uri $upstream_response_time字段
touch /home/test/python/log/log.txt
#安装相关模块
conda create -n science numpy scipy matplotlib pandas
#安装生成execl表格的相关模块
pip install xlwt

登入後複製

2.程式碼實作

#!/usr/local/miniconda2/envs/science/bin/python
#-*- coding: utf-8 -*-
#统计每个接口的响应时间
#请提前创建log.txt并设置logdir
import sys
import os
import pandas as pd
mulu=os.path.dirname(__file__)
#日志文件存放路径
logdir="/home/test/python/log/log"
#存放统计所需的日志相关字段
logfile_format=os.path.join(mulu,"log.txt")
print "read from logfile \n"
for eachfile in os.listdir(logdir):
 logfile=os.path.join(logdir,eachfile)
 with open(logfile, &#39;r&#39;) as fo:
  for line in fo:
   spline=line.split()
   #过滤字段中异常部分
   if spline[6]=="-":
    pass
   elif spline[6]=="GET":
    pass
   elif spline[-1]=="-":
    pass
   else:
    with open(logfile_format, &#39;a&#39;) as fw:
     fw.write(spline[6])
     fw.write(&#39;\t&#39;)
     fw.write(spline[-1])
     fw.write(&#39;\n&#39;)
print "output panda"
#将统计的字段读入到dataframe中
reader=pd.read_table(logfile_format,sep=&#39;\t&#39;,engine=&#39;python&#39;,names=["interface","reponse_time"] ,header=None,iterator=True)
loop=True
chunksize=10000000
chunks=[]
while loop:
 try:
  chunk=reader.get_chunk(chunksize)
  chunks.append(chunk)
 except StopIteration:
  loop=False
  print "Iteration is stopped."
df=pd.concat(chunks)
#df=df.set_index("interface")
#df=df.drop(["GET","-"])
df_groupd=df.groupby(&#39;interface&#39;)
df_groupd_max=df_groupd.max()
df_groupd_min= df_groupd.min()
df_groupd_mean= df_groupd.mean()
df_groupd_size= df_groupd.size()
#print df_groupd_max
#print df_groupd_min
#print df_groupd_mean
df_ana=pd.concat([df_groupd_max,df_groupd_min,df_groupd_mean,df_groupd_size],axis=1,keys=["max","min","average","count"])
print "output excel"
df_ana.to_excel("test.xls")

登入後複製

3.列印的表格如下：

要點

##1. 日誌檔案比較大的情況下讀取不要用readlines()、readline(),會將日誌全部讀到內存，導致內存佔滿。因此在此使用for line in fo迭代的方式，基本上不佔記憶體。

2. 讀取nginx日誌，可以使用pd.read_table(log_file, sep=' ', iterator=True),但是這裡我們設定的sep無法正常匹配分割，因此先將nginx用split分割，然後再存入pandas。

3. Pandas提供了IO工具可以將大檔案分塊讀取，使用不同分塊大小來讀取再呼叫pandas.concat 連接DataFrame

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7808

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1236

Related knowledge

docker容器名稱怎麼查 Apr 15, 2025 pm 12:21 PM

可以通過以下步驟查詢 Docker 容器名稱：列出所有容器（docker ps）。篩選容器列表（使用 grep 命令）。獲取容器名稱（位於 "NAMES" 列中）。

nginx在windows中怎麼配置 Apr 14, 2025 pm 12:57 PM

如何在 Windows 中配置 Nginx？安裝 Nginx 並創建虛擬主機配置。修改主配置文件並包含虛擬主機配置。啟動或重新加載 Nginx。測試配置並查看網站。選擇性啟用 SSL 並配置 SSL 證書。選擇性設置防火牆允許 80 和 443 端口流量。

怎麼查看nginx是否啟動 Apr 14, 2025 pm 01:03 PM

確認 Nginx 是否啟動的方法：1. 使用命令行：systemctl status nginx（Linux/Unix）、netstat -ano | findstr 80（Windows）；2. 檢查端口 80 是否開放；3. 查看系統日誌中 Nginx 啟動消息；4. 使用第三方工具，如 Nagios、Zabbix、Icinga。

docker怎麼啟動容器 Apr 15, 2025 pm 12:27 PM

Docker 容器啟動步驟：拉取容器鏡像：運行 "docker pull [鏡像名稱]"。創建容器：使用 "docker create [選項] [鏡像名稱] [命令和參數]"。啟動容器：執行 "docker start [容器名稱或 ID]"。檢查容器狀態：通過 "docker ps" 驗證容器是否正在運行。

nginx怎麼配置雲服務器域名 Apr 14, 2025 pm 12:18 PM

在雲服務器上配置 Nginx 域名的方法：創建 A 記錄，指向雲服務器的公共 IP 地址。在 Nginx 配置文件中添加虛擬主機塊，指定偵聽端口、域名和網站根目錄。重啟 Nginx 以應用更改。訪問域名測試配置。其他注意事項：安裝 SSL 證書啟用 HTTPS、確保防火牆允許 80 端口流量、等待 DNS 解析生效。

docker怎麼創建容器 Apr 15, 2025 pm 12:18 PM

在 Docker 中創建容器： 1. 拉取鏡像： docker pull [鏡像名] 2. 創建容器： docker run [選項] [鏡像名] [命令] 3. 啟動容器： docker start [容器名]

nginx怎麼查版本 Apr 14, 2025 am 11:57 AM

可以查詢 Nginx 版本的方法有：使用 nginx -v 命令；查看 nginx.conf 文件中的 version 指令；打開 Nginx 錯誤頁，查看頁面的標題。

怎麼啟動nginx服務器 Apr 14, 2025 pm 12:27 PM

啟動 Nginx 服務器需要按照不同操作系統採取不同的步驟：Linux/Unix 系統：安裝 Nginx 軟件包（例如使用 apt-get 或 yum）。使用 systemctl 啟動 Nginx 服務（例如 sudo systemctl start nginx）。 Windows 系統：下載並安裝 Windows 二進製文件。使用 nginx.exe 可執行文件啟動 Nginx（例如 nginx.exe -c conf\nginx.conf）。無論使用哪種操作系統，您都可以通過訪問服務器 IP

See all articles

python+pandas分析nginx日誌的實例

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題