Exemples d'analyse factorielle principale en Python
Dans les domaines de l'analyse des données et de l'apprentissage automatique, l'analyse en composantes principales (ACP) est un algorithme de réduction de dimensionnalité linéaire couramment utilisé. La PCA réduit la dimensionnalité des données en trouvant les principales composantes des données, améliorant ainsi l'interprétabilité et l'efficacité de calcul des données. Cet article illustrera les principes et les applications de la PCA à travers un exemple Python.
Tout d'abord, nous devons importer des bibliothèques liées à Python, telles que numpy, matplotlib, pandas, sklearn, etc.
1 2 3 4 5 |
|
Ensuite, nous chargeons les données. Ici, nous utilisons l'ensemble de données Iris, qui est un ensemble de données standard de classification et de regroupement, comprenant trois variétés d'iris. Nous utilisons la fonction read_csv() dans la bibliothèque pandas pour lire cet ensemble de données :
1 |
|
Maintenant, nous devons normaliser les données. Étant donné que la PCA est calculée sur la base de la matrice de covariance des données, la taille et l'ordre des tailles de la matrice de covariance sont déterminés par l'ampleur de la variation des données. Par conséquent, nous devons normaliser la plage de toutes les fonctionnalités à la même taille avant d'effectuer une analyse PCA. Nous pouvons utiliser StandardScaler de sklearn pour parvenir à la standardisation.
1 2 |
|
Ensuite, nous pouvons utiliser la méthode cov() dans numpy pour calculer la matrice de covariance des données, qui servira d'entrée à l'algorithme PCA.
1 |
|
Maintenant, nous pouvons utiliser la classe PCA pour trouver les principales composantes des données. Nous pouvons définir le nombre de composants principaux à conserver. Généralement, nous choisissons de conserver un nombre de composants principaux inférieur au nombre de fonctionnalités d’origine. Dans cet exemple nous garderons 2 composants principaux.
1 2 |
|
Maintenant, nous pouvons utiliser matplotlib pour tracer les résultats de la PCA. Le graphique obtenu est affiché dans un système de coordonnées bidimensionnel, où la couleur différente de chaque iris indique l'espèce à laquelle il appartient. Dans ce graphique, nous pouvons voir différents types de fleurs d’iris réparties dans différentes directions.
1 2 3 4 5 |
|
À travers cet exemple, nous pouvons voir le principe de fonctionnement et l'application du principe de l'analyse factorielle. La PCA est une technique très utile qui peut être utilisée dans de nombreux domaines tels que la visualisation de données, le filtrage du bruit, l'extraction de fonctionnalités et la compression de données. La PCA est donc un outil indispensable dans le domaine de l’analyse des données et de l’apprentissage automatique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

De nombreux développeurs de sites Web sont confrontés au problème de l'intégration de Node.js ou des services Python sous l'architecture de lampe: la lampe existante (Linux Apache MySQL PHP) a besoin d'un site Web ...

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Lorsque vous utilisez Scapy Crawler, la raison pour laquelle les fichiers de stockage persistants ne peuvent pas être écrits? Discussion Lorsque vous apprenez à utiliser Scapy Crawler pour les robots de données, vous rencontrez souvent un ...

Précision avec Python: Source de sablier Dessin graphique et vérification d'entrée Cet article résoudra le problème de définition variable rencontré par un novice Python dans le programme de dessin graphique de sablier. Code...

Python Process Pool gère les demandes TCP simultanées qui font coincé le client. Lorsque vous utilisez Python pour la programmation réseau, il est crucial de gérer efficacement les demandes TCP simultanées. ...

Explorez profondément la méthode de visualisation de Python Functools.Partial Objet dans Functools.Partial en utilisant Python ...

Choix de la bibliothèque de développement d'applications de bureau multiplateforme Python De nombreux développeurs Python souhaitent développer des applications de bureau pouvant s'exécuter sur Windows et Linux Systems ...

De nombreux développeurs s'appuient sur PYPI (PythonPackageIndex) ...
