こんにちは、kaggle で Web サイトの使用時間のデータセットを見つけたので、訪問したページ数と Web サイトの総滞在時間の比率を求めたいと思います。
データセットとコードは私の github にあります: https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic
これを行うには、Python で sqlalchemy を使用して CSV をデータベースに変換し、結果をプロットして表示します。
pip install plotly pip install sqlalchemy
Main クラスを作成し、get_data メソッドを使用して CSV を取得し、データベースに格納します。
結果はタプルのリストなので、二重リストを取得するためにtransform_dataメソッドを作成します。
最後に、閲覧されたページ数と合計時間の単純なグラフを表示できます。
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("website_wata.csv") self.df.to_sql("website_data", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text("SELECT Page_Views, Time_on_Page FROM website_data") self.result = self.connection.execute(query).fetchall() def transform_data(self): for i in range(len(self.result)): self.result[i] = list(self.result[i]) def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="" ) fig.show() Main()
X 軸はユーザーが訪問したページ数を示し、Y 軸は Web サイトで費やした時間を分単位で示します。
最も長く滞在するユーザーは 4 ページから 6 ページの間に訪問し、11 ページから 15 ページの間にはすべてのユーザーが少なくとも数分間滞在していることがわかります。
以上がウェブサイトの時刻データセットの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。