您好,我在kaggle上發現了一個網站使用時間的資料集,所以我想找到訪問頁面數與網站總時間之間的比率。
您可以在我的github中找到資料集和程式碼:https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic
為此,我在 python 中使用 sqlalchemy 將 csv 轉換為資料庫,並以繪圖方式顯示我的結果。
pip install plotly pip install sqlalchemy
我建立一個 Main 類,在其中使用 get_data 方法檢索 csv 並將其放入資料庫中。
結果是一個元組列表,因此我創建了transform_data方法來獲取雙列表。
最後,我可以顯示查看的頁面數量和總時間之間的簡單圖表。
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("website_wata.csv") self.df.to_sql("website_data", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text("SELECT Page_Views, Time_on_Page FROM website_data") self.result = self.connection.execute(query).fetchall() def transform_data(self): for i in range(len(self.result)): self.result[i] = list(self.result[i]) def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="" ) fig.show() Main()
x 軸表示使用者造訪的頁數,而 y 軸表示使用者在網站上花費的時間(以分鐘為單位)。
我們可以看到,在 4 到 6 個頁面之間停留時間最長的用戶,在 11 到 15 個頁面之間,所有用戶都至少停留了幾分鐘。
以上是網站時間資料集的詳細內容。更多資訊請關注PHP中文網其他相關文章!