Maison développement back-end Tutoriel Python Comment utiliser le test du chi carré pour l'analyse statistique en Python ?

Comment utiliser le test du chi carré pour l'analyse statistique en Python ?

Jun 03, 2023 pm 11:40 PM
python 统计分析 卡方检验

En tant que méthode statistique importante, le test du chi carré est l'une des méthodes de test couramment utilisées pour la relation entre les variables catégorielles. En Python, la bibliothèque SciPy fournit la fonction chi carré pour effectuer des tests du chi carré. Cet article présentera le principe, les exemples d'utilisation et de mise en œuvre du test du chi carré pour aider les lecteurs à mieux comprendre et appliquer le test du chi carré.

1. Principe du test du chi carré

L'idée principale du test du chi carré est de comparer la différence entre la valeur réelle observée et la valeur théorique. Si la différence entre les deux est significative, cela signifie que. il existe une relation entre les deux variables. Le test du chi carré analyse différemment les données dans différentes dimensions. Cet article présente principalement le principe du test du chi carré bidimensionnel.

Dans le cas d'un tableau bidimensionnel, le test du chi carré suppose d'abord qu'il n'y a pas de relation entre les deux variables, calcule la valeur attendue E sur la base de l'hypothèse, puis calcule la valeur du chi carré sur la base de la valeur réelle. la valeur observée O et la valeur attendue E, et calcule enfin la valeur du chi carré en consultant le tableau ou en calculant. Effectuez un test de signification pour déterminer si l'hypothèse est vraie.

La formule de calcul spécifique est la suivante :

Valeur du chi carré χ²=(O-E)²/E

Parmi eux, O est la valeur réelle observée et E est la valeur attendue.

Si la valeur du chi carré est plus grande, la relation entre les deux variables est plus significative et l'hypothèse est rejetée ; à l'inverse, si la valeur du chi carré est plus petite, la relation est moins significative et l'hypothèse est acceptée ;

2. Utilisation du test du chi carré

  1. Préparation des données

Avant d'effectuer le test du chi carré, vous devez préparer les données. De manière générale, les données existent sous la forme d'un tableau bidimensionnel, comprenant à la fois la valeur réelle observée O et la valeur attendue E, comme suit :

     类别A          类别B
Copier après la connexion

Variable 1 70 30
Variable 2 40 60

Parmi elles, 70 représente variable 1 et Nombre d'intersections pour la catégorie A.

  1. Calculez la valeur du chi carré en fonction des données

Utilisez la bibliothèque SciPy en Python pour calculer facilement la valeur du chi carré et la valeur p correspondante. Le code est le suivant :

from scipy.stats import chisquare
import numpy as np

obs = np.array([[70, 30], [40, 60]])  #实际观测值
exp = np.array([[50, 50], [50, 50]])  #期望值

stat, pval = chisquare(obs.ravel(), f_exp=exp.ravel())
print(stat, pval)
Copier après la connexion

Parmi eux, la fonction chi carré est utilisée pour calculer la valeur du chi carré et la valeur p correspondante, obs et exp représentent respectivement la valeur réelle observée et la valeur attendue, la fonction ravel() convertit le tableau bidimensionnel en un tableau unidimensionnel et le paramètre f_exp spécifie la valeur attendue. Lorsqu'il est défini sur Aucun, utilisez obs.sum()/4 comme valeur attendue.

  1. Test de l'hypothèse

Après avoir obtenu la valeur du chi carré et la valeur p, vous devez déterminer si l'hypothèse est vraie. Généralement, le niveau de signification α est fixé à 0,05. Si la valeur p est inférieure ou égale à α, l'hypothèse nulle est rejetée, indiquant qu'il existe une relation entre les deux variables. Dans le cas contraire, l'hypothèse nulle est acceptée, indiquant qu'il existe une relation entre les deux variables. il n'y a pas de relation.

Le code est le suivant :

alpha = 0.05

if pval <= alpha:
    print("Reject null hypothesis, variables are related.")
else:
    print("Accept null hypothesis, variables are independent.")
Copier après la connexion

3. Exemple d'implémentation

Ce qui suit est un exemple simple pour démontrer l'utilisation du test du chi carré. Supposons qu'un test A/B soit effectué sur un site e-commerce pour tester si le temps de connexion de l'utilisateur a un impact sur le temps de navigation du site. Les données sont les suivantes :

     浏览时长<10s      浏览时长>=10s
Copier après la connexion
Copier après la connexion

Connexion A 1000 2000
Connexion B 1500. 2500

Tout d'abord, vous devez calculer la valeur attendue E. Selon La valeur attendue obtenue par le calcul des données est la suivante :

     浏览时长<10s      浏览时长>=10s
Copier après la connexion
Copier après la connexion

Connexion A 1200 1800
Connexion B 1300 1900

Utilisez le code Python pour le calcul et les tests d'hypothèse comme suit :

obs = np.array([[1000, 2000], [1500, 2500]])  #实际观测值
exp = np.array([[1200, 1800], [1300, 1900]])  #期望值

stat, pval = chisquare(obs.ravel(), f_exp=exp.ravel())
print(stat, pval)

alpha = 0.05

if pval <= alpha:
    print("Reject null hypothesis, variables are related.")
else:
    print("Accept null hypothesis, variables are independent.")
Copier après la connexion

Le résultat final est : rejeter l'hypothèse nulle, indiquant que la méthode de connexion de l'utilisateur a un impact sur le temps de navigation .

4. Résumé

Le test du chi carré est une méthode de test couramment utilisée pour la relation entre des variables catégorielles, qui peut déterminer s'il existe une relation entre deux variables. En Python, le test du chi carré peut être facilement effectué à l'aide de la fonction chi carré fournie par la bibliothèque SciPy. Grâce à l'introduction de cet article, les lecteurs peuvent mieux comprendre et utiliser le test du chi carré, et l'analyse statistique des données peut être plus standardisée et scientifique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

HaDIDB: une base de données légère et évolutive horizontalement dans Python HaDIDB: une base de données légère et évolutive horizontalement dans Python Apr 08, 2025 pm 06:12 PM

HaDIDB: Une base de données Python évolutive de haut niveau légère HaDIDB (HaDIDB) est une base de données légère écrite en Python, avec un niveau élevé d'évolutivité. Installez HaDIDB à l'aide de l'installation PIP: PiPinStallHaDIDB User Management Créer un utilisateur: CreateUser () pour créer un nouvel utilisateur. La méthode Authentication () authentifie l'identité de l'utilisateur. FromHadidb.OperationMportUserUser_OBJ = User ("Admin", "Admin") User_OBJ.

Méthode de Navicat pour afficher le mot de passe de la base de données MongoDB Méthode de Navicat pour afficher le mot de passe de la base de données MongoDB Apr 08, 2025 pm 09:39 PM

Il est impossible de visualiser le mot de passe MongoDB directement via NAVICAT car il est stocké sous forme de valeurs de hachage. Comment récupérer les mots de passe perdus: 1. Réinitialiser les mots de passe; 2. Vérifiez les fichiers de configuration (peut contenir des valeurs de hachage); 3. Vérifiez les codes (May Code Hardcode).

Python: Explorer ses applications principales Python: Explorer ses applications principales Apr 10, 2025 am 09:41 AM

Python est largement utilisé dans les domaines du développement Web, de la science des données, de l'apprentissage automatique, de l'automatisation et des scripts. 1) Dans le développement Web, les cadres Django et Flask simplifient le processus de développement. 2) Dans les domaines de la science des données et de l'apprentissage automatique, les bibliothèques Numpy, Pandas, Scikit-Learn et Tensorflow fournissent un fort soutien. 3) En termes d'automatisation et de script, Python convient aux tâches telles que les tests automatisés et la gestion du système.

Le plan Python de 2 heures: une approche réaliste Le plan Python de 2 heures: une approche réaliste Apr 11, 2025 am 12:04 AM

Vous pouvez apprendre les concepts de programmation de base et les compétences de Python dans les 2 heures. 1. Apprenez les variables et les types de données, 2. Flux de contrôle maître (instructions et boucles conditionnelles), 3. Comprenez la définition et l'utilisation des fonctions, 4. Démarrez rapidement avec la programmation Python via des exemples simples et des extraits de code.

Comment optimiser les performances MySQL pour les applications de haute charge? Comment optimiser les performances MySQL pour les applications de haute charge? Apr 08, 2025 pm 06:03 PM

Guide d'optimisation des performances de la base de données MySQL dans les applications à forte intensité de ressources, la base de données MySQL joue un rôle crucial et est responsable de la gestion des transactions massives. Cependant, à mesure que l'échelle de l'application se développe, les goulots d'étranglement des performances de la base de données deviennent souvent une contrainte. Cet article explorera une série de stratégies efficaces d'optimisation des performances MySQL pour garantir que votre application reste efficace et réactive dans des charges élevées. Nous combinerons des cas réels pour expliquer les technologies clés approfondies telles que l'indexation, l'optimisation des requêtes, la conception de la base de données et la mise en cache. 1. La conception de l'architecture de la base de données et l'architecture optimisée de la base de données sont la pierre angulaire de l'optimisation des performances MySQL. Voici quelques principes de base: sélectionner le bon type de données et sélectionner le plus petit type de données qui répond aux besoins peut non seulement économiser un espace de stockage, mais également améliorer la vitesse de traitement des données.

Comment utiliser Aws Glue Crawler avec Amazon Athena Comment utiliser Aws Glue Crawler avec Amazon Athena Apr 09, 2025 pm 03:09 PM

En tant que professionnel des données, vous devez traiter de grandes quantités de données provenant de diverses sources. Cela peut poser des défis à la gestion et à l'analyse des données. Heureusement, deux services AWS peuvent aider: AWS Glue et Amazon Athena.

MySQL peut-il se connecter au serveur SQL MySQL peut-il se connecter au serveur SQL Apr 08, 2025 pm 05:54 PM

Non, MySQL ne peut pas se connecter directement à SQL Server. Mais vous pouvez utiliser les méthodes suivantes pour implémenter l'interaction des données: utilisez Middleware: Exporter les données de MySQL au format intermédiaire, puis importez-les sur SQL Server via Middleware. Utilisation de Database Linker: Business Tools fournit une interface plus conviviale et des fonctionnalités avancées, essentiellement encore implémentées via Middleware.

Comment démarrer le serveur avec redis Comment démarrer le serveur avec redis Apr 10, 2025 pm 08:12 PM

Les étapes pour démarrer un serveur Redis incluent: Installez Redis en fonction du système d'exploitation. Démarrez le service Redis via Redis-Server (Linux / MacOS) ou Redis-Server.exe (Windows). Utilisez la commande redis-Cli Ping (Linux / MacOS) ou redis-Cli.exe Ping (Windows) pour vérifier l'état du service. Utilisez un client redis, tel que redis-cli, python ou node.js pour accéder au serveur.

See all articles