Le test de Brown-Forsythe est un test statistique utilisé pour déterminer si les variances de deux groupes ou plus sont égales. Le test de Levene utilise l'écart absolu par rapport à la moyenne, tandis que le test de Brown-Forsythe utilise l'écart par rapport à la médiane.
L'hypothèse nulle utilisée dans le test est la suivante -
H0 : Les variances des groupes (population) sont égales
L'hypothèse alternative est que les écarts ne sont pas égaux -
H1 : Les variances des groupes (populations) ne sont pas égales
Pour réaliser le test, nous calculons la médiane de chaque groupe et l'écart absolu par rapport à la médiane. Nous calculons ensuite la statistique F en fonction de la variance de ces écarts. Supposons que la statistique F calculée soit supérieure à la valeur critique dans le tableau de distribution F. Dans ce cas, nous rejetons l’hypothèse nulle et concluons que les variances des groupes ne sont pas égales.
En Python, les bibliothèques scipy et statsmodels fournissent des méthodes pour effectuer des tests Brown-Forsythe.
Il est à noter que le test de Brown-Forsythe est sensible aux valeurs aberrantes mais plus robuste à la non-normalité que le test de Levene. Si les données sont anormales, il est généralement recommandé d'utiliser le test de Brown-Forsythe.
levene(sample1, sample2, …sampleN, center=’median’, proportiontocut=0.05)
sample1, sample2, …sampleN - exemples de données, qui peuvent être de différentes longueurs. Les échantillons doivent avoir une seule dimension pour être acceptés.
Center - Fonction de données pour les tests. La médiane est la valeur par défaut.
Proportiontocut - Indique le nombre de points de données supprimés de chaque extrémité lorsque le centre est "rogné".
Dans la fonction levene(), l'utilisateur doit transmettre les données d'échantillon 1D de différentes longueurs ainsi que le paramètre centre comme "Médiane". La fonction renvoie ensuite les statistiques et p_value pour l'échantillon fourni.
Importez la fonction levene depuis scipy.
Créez l'échantillon de données sur lequel effectuer le test de Brown-Forsythe.
Transmettez des exemples de données à la fonction levene pour exécuter le test.
Renvoyer les statistiques et p_value des fonctions.
Vous pouvez utiliser des statistiques. La méthode Levene de la bibliothèque scipy est utilisée pour effectuer le test de Brown-Forsythe.
from scipy.stats import levene group1 = [1, 2, 3, 4, 5] group2 = [2, 3, 4, 5, 6] group3 = [3, 4, 5, 6, 7] statistic, pvalue = levene(group1, group2, group3) print("statistic: ", statistic) print("p-value: ", pvalue)
statistic: 0.0 p-value: 1.0
Ici, vous pouvez voir que la valeur p est de 1, ce qui est supérieur à 0,05. Cela signifie que nous pouvons accepter l'hypothèse nulle. Les variances des deux groupes sont donc les mêmes. L’hypothèse alternative est donc rejetée.
En plus de mettre en œuvre le problème de Brown-Forsythe, nous devons également clarifier une confusion courante à laquelle sont confrontés les ingénieurs en apprentissage automatique. C’est ainsi que les tests de Brown-Forsythe et ANOVA sont liés les uns aux autres.
Les tests de Brown-Forsythe et ANOVA (analyse de variance) sont liés car ils testent les différences dans les moyennes des groupes. Cependant, ils testent différentes hypothèses et ont des applications différentes.
L'analyse de variance est une méthode statistique utilisée pour tester s'il existe des différences significatives entre les moyennes de deux groupes ou plus. Cela suppose que les variances des groupes sont égales et que les données sont normalement distribuées. L'analyse de variance est utilisée pour déterminer si les moyennes de deux groupes ou plus sont égales et pour comparer les variances des groupes.
Le test de Brown-Forsythe est une variante du test de Levene, qui utilise l'écart absolu par rapport à la moyenne, tandis que le test de Brown-Forsythe utilise l'écart par rapport à la médiane. Le test de Brown-Forsythe, quant à lui, est un test d’homogénéité des variances, hypothèse nécessaire à l’analyse de la variance. Utilisé pour déterminer si les variances de deux groupes ou plus sont égales.
En pratique, il est courant d'effectuer un test de Brown-Forsythe avant l'ANOVA pour vérifier si l'hypothèse d'égalité des variances est respectée. Si les variances ne sont pas égales, il peut être approprié d'utiliser un test non paramétrique (tel que le test de Kruskal-Wallis ou le test ANOVA de Welch) au lieu du test régulier.
Le test de Brown-Forsythe est utilisé dans divers domaines tels que la biologie, la médecine, la psychologie, les sciences sociales et l'ingénierie pour tester des variances égales dans différents groupes. Certains cas d'utilisation courants incluent -
Comparez les variances de deux échantillons ou plus - Le test de Brown-Forsythe peut déterminer si les variances de deux échantillons ou plus sont égales. Par exemple, dans la recherche médicale, ce test peut être utilisé pour comparer la variance des mesures de tension artérielle dans différents groupes de patients.
Test d'homogénéité des variances avant d'effectuer une ANOVA - Le test de Brown-Forsythe étant un test d'homogénéité des variances, il peut être utilisé pour vérifier si l'hypothèse d'égalité des variances est remplie avant d'effectuer une ANOVA. Cela garantit que les résultats de l’ANOVA sont valides.
Test de variances égales dans des données non distribuées normalement - Le test de Brown-Forsythe est plus robuste à la non-normalité que le test de Levene. Il peut être utilisé pour tester des variances égales dans des données non distribuées normalement.
Comparaison des variances dans des plans de mesures répétées - Lorsque vous effectuez des expériences utilisant un plan de mesures répétées, il est utile d'utiliser le test de Brown-Forsythe pour vérifier l'homogénéité des variances entre les groupes.
Contrôle qualité dans la fabrication - Le test Brown-Forsythe peut être utilisé pour vérifier les écarts égaux dans différents lots de production afin de garantir une qualité constante du produit.
En résumé, le test de Brown-Forsythe est une méthode statistique utile pour détecter la présence d'hétéroscédasticité dans un ensemble de données. Il peut être facilement implémenté en Python à l'aide de la bibliothèque scipy. Les résultats des tests peuvent éclairer les décisions concernant la réalisation d’une analyse statistique appropriée des données. En comprenant les hypothèses testées et en interprétant les résultats, les chercheurs peuvent mieux comprendre la distribution des données et prendre des décisions éclairées concernant leur analyse.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!