안녕하세요 웹사이트 이용시간에 Kaggle에서 데이터셋을 찾았는데, 방문한 페이지 수와 웹사이트에 머문 총 시간의 비율을 알고 싶습니다.
내 github에서 데이터 세트와 코드를 찾을 수 있습니다: https://github.com/victordalet/Kaggle_analytic/tree/feat/website_traffic
이를 위해 Python에서 sqlalchemy를 사용하여 csv를 데이터베이스로 변환하고 결과를 플롯으로 표시합니다.
pip install plotly pip install sqlalchemy
저는 get_data 메소드를 사용하여 내 csv를 검색하고 데이터베이스에 저장하는 Main 클래스를 만듭니다.
결과는 튜플 목록이므로 이중 목록을 얻기 위해 변환_데이터 메소드를 생성합니다.
마지막으로, 조회한 페이지 수와 총 시간을 간단한 그래프로 표시할 수 있습니다.
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("website_wata.csv") self.df.to_sql("website_data", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text("SELECT Page_Views, Time_on_Page FROM website_data") self.result = self.connection.execute(query).fetchall() def transform_data(self): for i in range(len(self.result)): self.result[i] = list(self.result[i]) def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="" ) fig.show() Main()
x축은 사용자가 방문한 페이지 수를 나타내고, y축은 웹사이트에서 보낸 시간을 분 단위로 나타냅니다.
가장 오래 머무르는 사용자는 4~6페이지에서, 11~15페이지에서는 모든 사용자가 최소 몇 분 이상 머무르는 것을 확인할 수 있습니다.
위 내용은 웹사이트 시간 데이터세트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!