網站時間資料集

王林
發布: 2024-09-03 14:41:10
原創
658 人瀏覽過

您好,我在kaggle上發現了一個網站使用時間的資料集,所以我想找到訪問頁面數與網站總時間之間的比率。

您可以在我的github中找到資料集和程式碼:https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


一、安裝

為此,我在 python 中使用 sqlalchemy 將 csv 轉換為資料庫,並以繪圖方式顯示我的結果。

pip install plotly
pip install sqlalchemy
登入後複製

II - 代碼

我建立一個 Main 類,在其中使用 get_data 方法檢索 csv 並將其放入資料庫中。
結果是一個元組列表,因此我創建了transform_data方法來獲取雙列表。
最後,我可以顯示查看的頁面數量和總時間之間的簡單圖表。

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()
登入後複製

III - 結果

x 軸表示使用者造訪的頁數,而 y 軸表示使用者在網站上花費的時間(以分鐘為單位)。

我們可以看到,在 4 到 6 個頁面之間停留時間最長的用戶,在 11 到 15 個頁面之間,所有用戶都至少停留了幾分鐘。

Website Time dataset

以上是網站時間資料集的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板