Table des matières

Lire l'ensemble de données Iris

Afficher le ensemble de données Les premières lignes

Afficher les informations de base de l'ensemble de données

Dessiner un histogramme

Tracer un histogramme

Dessinez un nuage de points

Calculez la matrice des coefficients de corrélation entre les variables

Dessiner une carte thermique

Dessinez la matrice de dispersion

Dessiner des tracés de coordonnées parallèles

Maison

développement back-end

Tutoriel Python

Comment faire de la visualisation et de l'exploration de données en Python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 21, 2023 am 08:58 AM

python 数据可视化探索

Comment faire de la visualisation et de lexploration de données en Python

Comment effectuer la visualisation et l'exploration des données en Python

La visualisation et l'exploration des données sont l'un des aspects importants de l'analyse des données. Avec l'aide de diverses bibliothèques et outils puissants en Python, nous pouvons facilement effectuer la visualisation et l'exploration des données. Cet article présentera les bibliothèques et techniques de visualisation de données couramment utilisées en Python et donnera des exemples de code spécifiques.

Introduction
La visualisation de données est une méthode d'affichage de données abstraites de manière intuitive et facile à comprendre. Grâce à la visualisation, nous pouvons mieux comprendre la distribution, les relations et les caractéristiques des données. Il existe de nombreuses bibliothèques et outils de visualisation de données en Python, tels que Matplotlib, Seaborn, Plotly, etc.
Préparation des données
Avant de faire de la visualisation de données, vous devez d'abord préparer les données à analyser. Cet article prend l'ensemble de données Iris comme exemple. L'ensemble de données Iris est un ensemble de données classique de la bibliothèque d'apprentissage automatique UCI. Il contient 150 échantillons de trois variétés de fleurs d'iris (Setosa, Versicolor et Virginica). les caractéristiques (longueur des sépales, largeur des sépales, longueur des pétales, largeur des pétales) sont incluses.

Tout d'abord, vous devez installer la bibliothèque pandas pour le traitement et l'analyse des données. Ensuite, utilisez le code suivant pour lire l'ensemble de données Iris et préparer une visualisation simple des données :

importer des pandas en tant que pd

Lire l'ensemble de données Iris

iris_data = pd.read_csv('iris.csv')

Afficher le ensemble de données Les premières lignes

print(iris_data.head())

Afficher les informations de base de l'ensemble de données

print(iris_data.info())

Visualisation des données univariées
La visualisation des données univariées fait référence à la distribution d'une visualisation à variable unique. Les méthodes couramment utilisées incluent les histogrammes, les histogrammes et les boxplots.

En prenant la longueur des sépales comme exemple, l'exemple de code pour utiliser la bibliothèque Matplotlib pour dessiner un histogramme est le suivant :

importer matplotlib.pyplot en tant que plt

Dessiner un histogramme

plt.bar(iris_data['Species' ], iris_data['Sepal length'])
plt.xlabel('Species') # Définir l'étiquette de l'axe x
plt.ylabel('Sepal length') # Définir l'étiquette de l'axe y
plt.title('Distribution de la longueur des sépales') # Définissez le titre du graphique
plt.show()

De plus, vous pouvez également utiliser la bibliothèque Seaborn pour dessiner des histogrammes et des boîtes à moustaches. Voici un exemple de code pour dessiner un histogramme :

importer seaborn en tant que sns

Tracer un histogramme

sns.histplot(data=iris_data, x='Sepal length', kde=True)
plt.xlabel('Sepal length' ) # Définissez l'étiquette de l'axe x
plt.ylabel('Count') # Définissez l'étiquette de l'axe y
plt.title('Distribution of Sepal length') # Définissez le titre du graphique
plt.show()

Visualisation de données à double variable
La visualisation de données bivariées fait référence à la visualisation de la relation entre deux variables. Les méthodes couramment utilisées incluent les nuages de points et les cartes thermiques.

En prenant comme exemple la longueur des sépales et la longueur des pétales, l'exemple de code pour utiliser la bibliothèque Matplotlib pour dessiner un nuage de points est le suivant :

Dessinez un nuage de points

plt.scatter(iris_data['Sepal length'], iris_data['Petal length' ])
plt.xlabel('Sepal length') # Définir l'étiquette de l'axe x
plt.ylabel('Petal length') # Définir l'étiquette de l'axe y
plt.title('Relation between Longueur des sépales et longueur des pétales') # Définissez le titre du graphique
plt.show()

De plus, vous pouvez également utiliser la bibliothèque Seaborn pour dessiner une carte thermique afin de montrer la corrélation entre les variables. Voici un exemple de code pour dessiner une carte thermique :

Calculez la matrice des coefficients de corrélation entre les variables

correlation_matrix = iris_data[['Longueur des sépales', 'Largeur des sépales', 'Longueur des pétales', 'Largeur des pétales']]. corr( )

Dessiner une carte thermique

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

Visualisation de données multivariables
Multivariable La visualisation des données fait référence à la visualisation de la relation entre plusieurs variables. Les méthodes couramment utilisées incluent les matrices de dispersion et les tracés de coordonnées parallèles.

En prenant les quatre fonctionnalités de l'ensemble de données Iris comme exemple, l'exemple de code d'utilisation de la bibliothèque Seaborn pour dessiner la matrice de dispersion est le suivant :

Dessinez la matrice de dispersion

sns.pairplot(iris_data, hue ='Species')
plt.show ()

De plus, vous pouvez également utiliser la bibliothèque Plotly pour dessiner des tracés de coordonnées parallèles. Voici un exemple de code pour dessiner des tracés de coordonnées parallèles :

importer plotly.express en tant que px

Dessiner des tracés de coordonnées parallèles

fig = px.parallel_coordonnées(iris_data, color='Species')
fig.show()

Résumé
Cet article présente les méthodes de visualisation et d'exploration des données en Python et donne des exemples de code spécifiques. Grâce à la visualisation et à l'exploration des données, nous pouvons mieux comprendre la distribution, les relations et les caractéristiques des données, fournissant ainsi une base et des conseils pour l'analyse et la modélisation ultérieures des données. Dans les applications pratiques, des méthodes et technologies de visualisation appropriées peuvent également être sélectionnées en fonction de besoins spécifiques et des caractéristiques des données pour explorer davantage la valeur des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Économie dans R.E.P.O. Expliqué (et enregistrer des fichiers)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

4 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7569

Tutoriel CakePHP

1386

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

107

Afficher plus

Related knowledge

PHP et Python: exemples de code et comparaison Apr 15, 2025 am 12:07 AM

PHP et Python ont leurs propres avantages et inconvénients, et le choix dépend des besoins du projet et des préférences personnelles. 1.Php convient au développement rapide et à la maintenance des applications Web à grande échelle. 2. Python domine le domaine de la science des données et de l'apprentissage automatique.

Python vs JavaScript: communauté, bibliothèques et ressources Apr 15, 2025 am 12:16 AM

Python et JavaScript ont leurs propres avantages et inconvénients en termes de communauté, de bibliothèques et de ressources. 1) La communauté Python est amicale et adaptée aux débutants, mais les ressources de développement frontal ne sont pas aussi riches que JavaScript. 2) Python est puissant dans les bibliothèques de science des données et d'apprentissage automatique, tandis que JavaScript est meilleur dans les bibliothèques et les cadres de développement frontaux. 3) Les deux ont des ressources d'apprentissage riches, mais Python convient pour commencer par des documents officiels, tandis que JavaScript est meilleur avec MDNWEBDOCS. Le choix doit être basé sur les besoins du projet et les intérêts personnels.

Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

Le code Visual Studio peut-il être utilisé dans Python Apr 15, 2025 pm 08:18 PM

VS Code peut être utilisé pour écrire Python et fournit de nombreuses fonctionnalités qui en font un outil idéal pour développer des applications Python. Il permet aux utilisateurs de: installer des extensions Python pour obtenir des fonctions telles que la réalisation du code, la mise en évidence de la syntaxe et le débogage. Utilisez le débogueur pour suivre le code étape par étape, trouver et corriger les erreurs. Intégrez Git pour le contrôle de version. Utilisez des outils de mise en forme de code pour maintenir la cohérence du code. Utilisez l'outil de liaison pour repérer les problèmes potentiels à l'avance.

Comment exécuter des programmes dans Terminal Vscode Apr 15, 2025 pm 06:42 PM

Dans VS Code, vous pouvez exécuter le programme dans le terminal via les étapes suivantes: Préparez le code et ouvrez le terminal intégré pour vous assurer que le répertoire de code est cohérent avec le répertoire de travail du terminal. Sélectionnez la commande Run en fonction du langage de programmation (tel que Python de Python your_file_name.py) pour vérifier s'il s'exécute avec succès et résoudre les erreurs. Utilisez le débogueur pour améliorer l'efficacité du débogage.

L'extension VScode est-elle malveillante? Apr 15, 2025 pm 07:57 PM

Les extensions de code vs posent des risques malveillants, tels que la cachette de code malveillant, l'exploitation des vulnérabilités et la masturbation comme des extensions légitimes. Les méthodes pour identifier les extensions malveillantes comprennent: la vérification des éditeurs, la lecture des commentaires, la vérification du code et l'installation avec prudence. Les mesures de sécurité comprennent également: la sensibilisation à la sécurité, les bonnes habitudes, les mises à jour régulières et les logiciels antivirus.

Python: automatisation, script et gestion des tâches Apr 16, 2025 am 12:14 AM

Python excelle dans l'automatisation, les scripts et la gestion des tâches. 1) Automatisation: La sauvegarde du fichier est réalisée via des bibliothèques standard telles que le système d'exploitation et la fermeture. 2) Écriture de script: utilisez la bibliothèque PSUTIL pour surveiller les ressources système. 3) Gestion des tâches: utilisez la bibliothèque de planification pour planifier les tâches. La facilité d'utilisation de Python et la prise en charge de la bibliothèque riche en font l'outil préféré dans ces domaines.

Peut-on exécuter le code sous Windows 8 Apr 15, 2025 pm 07:24 PM

VS Code peut fonctionner sur Windows 8, mais l'expérience peut ne pas être excellente. Assurez-vous d'abord que le système a été mis à jour sur le dernier correctif, puis téléchargez le package d'installation VS Code qui correspond à l'architecture du système et l'installez comme invité. Après l'installation, sachez que certaines extensions peuvent être incompatibles avec Windows 8 et doivent rechercher des extensions alternatives ou utiliser de nouveaux systèmes Windows dans une machine virtuelle. Installez les extensions nécessaires pour vérifier si elles fonctionnent correctement. Bien que le code VS soit possible sur Windows 8, il est recommandé de passer à un système Windows plus récent pour une meilleure expérience de développement et une meilleure sécurité.

See all articles