웹사이트 시간 데이터세트

王林
풀어 주다: 2024-09-03 14:41:10
원래의
663명이 탐색했습니다.

안녕하세요 웹사이트 이용시간에 Kaggle에서 데이터셋을 찾았는데, 방문한 페이지 수와 웹사이트에 머문 총 시간의 비율을 알고 싶습니다.

내 github에서 데이터 세트와 코드를 찾을 수 있습니다: https://github.com/victordalet/Kaggle_analytic/tree/feat/website_traffic


나 - 설치

이를 위해 Python에서 sqlalchemy를 사용하여 csv를 데이터베이스로 변환하고 결과를 플롯으로 표시합니다.

pip install plotly
pip install sqlalchemy
로그인 후 복사

II - 코드

저는 get_data 메소드를 사용하여 내 csv를 검색하고 데이터베이스에 저장하는 Main 클래스를 만듭니다.
결과는 튜플 목록이므로 이중 목록을 얻기 위해 변환_데이터 메소드를 생성합니다.
마지막으로, 조회한 페이지 수와 총 시간을 간단한 그래프로 표시할 수 있습니다.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()
로그인 후 복사

III - 결과

x축은 사용자가 방문한 페이지 수를 나타내고, y축은 웹사이트에서 보낸 시간을 분 단위로 나타냅니다.

가장 오래 머무르는 사용자는 4~6페이지에서, 11~15페이지에서는 모든 사용자가 최소 몇 분 이상 머무르는 것을 확인할 수 있습니다.

Website Time dataset

위 내용은 웹사이트 시간 데이터세트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿