Maison développement back-end Tutoriel Python Introduction à quatre méthodes de visualisation de données Python (avec exemples)

Introduction à quatre méthodes de visualisation de données Python (avec exemples)

Nov 27, 2018 pm 03:33 PM
pandas python 数据可视化 机器学习 深度学习

Cet article vous présente une introduction à quatre méthodes de visualisation de données en Python (avec des exemples). Il a une certaine valeur de référence. Les amis dans le besoin pourront s'y référer.

Résumé : Cet article décrit quatre méthodes de visualisation de données Python : carte thermique, carte de densité bidimensionnelle, carte en araignée et carte arborescente.

La visualisation des données est une partie importante de tout projet de science des données ou d'apprentissage automatique. Les gens commencent souvent par une analyse exploratoire des données (EDA) pour mieux comprendre leurs données, et la création de visualisations peut vraiment aider à rendre les problèmes plus clairs et plus faciles à comprendre, en particulier pour les ensembles de données plus volumineux et de grande dimension. À la fin d'un projet, il est important de pouvoir présenter le résultat final de manière claire, concise et convaincante que vos utilisateurs puissent comprendre et comprendre.

Vous avez peut-être lu mon article précédent "5 visualisations de données rapides et faciles en Python avec Code" , qui présente 5 méthodes de visualisation de base : nuages ​​de points, graphiques linéaires, histogrammes, diagrammes à barres et diagrammes en boîte. . Ces cinq méthodes de visualisation sont simples mais puissantes avec lesquelles vous pouvez certainement tirer d’énormes gains de vos ensembles de données. Dans cet article, nous présenterons 4 autres méthodes de visualisation de données, mais elles sont légèrement plus compliquées. Vous pouvez les utiliser après avoir lu les méthodes de base présentées dans l'article précédent.

Carte thermique

Une carte thermique est une représentation matricielle de données, où chaque valeur matricielle est représentée par une couleur. Différentes couleurs représentent différents niveaux et l'index matriciel relie deux colonnes ou caractéristiques contrastées. Les cartes thermiques sont idéales pour montrer les relations entre plusieurs variables de caractéristiques, car un niveau peut être visualisé directement sous forme de couleur. Vous pouvez également voir comment chaque relation se compare aux autres relations de l'ensemble de données en examinant certains points de la carte thermique. Les couleurs fournissent une représentation simple car très intuitive.

Introduction à quatre méthodes de visualisation de données Python (avec exemples)

Regardez maintenant le code : par rapport à la bibliothèque matplotlib, la bibliothèque seaborn peut être utilisée pour des graphiques plus avancés et nécessite généralement plus de composants, tels que comme plus de couleurs, de graphiques ou de variables. La bibliothèque Matplotlib est utilisée pour afficher des graphiques, numpy est utilisé pour générer des données et pandas est utilisé pour le contrôle. Le traçage n'est qu'un simple appel de fonction Seaborn, et si vous trouvez quelque chose de visuellement spécial, vous pouvez également définir la carte des couleurs via cette fonction.

# Importing libs
importseaborn as sns
import pandas aspd
importnumpyasnp
importmatplotlib.pyplotasplt

# Create a random dataset
data=pd.DataFrame(np.random.random((10,6)), columns=["Iron Man","CaptainAmerica","BlackWidow","Thor","Hulk", "Hawkeye"])

print(data)

# Plot the heatmap
heatmap_plot=sns.heatmap(data, center=0, cmap='gist_ncar')

plt.show()
Copier après la connexion

2D Density Plot (2D Density Plot)

Le 2D Density Plot est une simple extension de la version unidimensionnelle qui vous permet de voir la relation distribution de probabilité entre deux variables. Regardons le tracé de densité 2D ci-dessous. L'échelle de droite représente la probabilité de chaque point en couleur. La probabilité la plus élevée, en regardant l'ensemble de données, semble être d'environ 0,5 en taille et 1,4 en vitesse. Comme vous pouvez le constater, les tracés de densité 2D sont parfaits pour déterminer rapidement les zones de données les plus concentrées pour deux variables, plutôt que pour une seule variable comme les tracés de densité 1D. Les tracés de densité bidimensionnels sont particulièrement utiles lorsque vous disposez de deux variables importantes pour le résultat et que vous souhaitez comprendre comment elles contribuent ensemble à la distribution du résultat.

Introduction à quatre méthodes de visualisation de données Python (avec exemples)

Le code de Seaborn est super simple et nous allons l'introduire en créant une distribution asymétrique. Si vous trouvez que certaines couleurs et nuances sont visuellement plus distinctives, la plupart des paramètres facultatifs visent à un aspect plus clair.

Spider Plot

Spider Plot est l'un des meilleurs moyens d'afficher des relations un-à-plusieurs. Autrement dit, vous pouvez tracer et afficher les valeurs de plusieurs variables par opposition à une seule variable ou catégorie. Dans un diagramme en araignée, les propriétés d’une variable par rapport à une autre sont évidentes car l’aire et la longueur varient dans certaines directions. Si vous souhaitez voir comment les variables se superposent pour plusieurs catégories, tracez-les côte à côte. Dans l'image ci-dessous, il est facile de comparer les différents attributs de trois personnages de films et de voir où se situent leurs points forts !

Introduction à quatre méthodes de visualisation de données Python (avec exemples)

Cette fois, nous pourrons utiliser matplotlib directement pour créer des visualisations au lieu de seaborn. L'angle auquel se trouve chaque attribut doit être calculé car nous voulons qu'ils soient uniformément espacés le long de la circonférence. Nous placerons des étiquettes à chaque angle calculé, puis tracerons la valeur sous la forme d'un point dont la distance par rapport au centre dépend de sa valeur ou de son niveau. Enfin, pour plus de clarté, nous remplirons la zone contenue par les lignes reliant les points de propriété avec une couleur semi-transparente.

# Import libs
import pandas aspd
importseabornassns
importnumpyasnp
importmatplotlib.pyplotasplt

# Get the data
df=pd.read_csv("avengers_data.csv")
print(df)

"""
   #             Name  Attack  Defense  Speed  Range  Health
0  1         Iron Man      83       80     75     70      70
1  2  Captain America      60       62     63     80      80
2  3             Thor      80       82     83    100     100
3  3             Hulk      80      100     67     44      92
4  4      Black Widow      52       43     60     50      65
5  5          Hawkeye      58       64     58     80      65

"""

# Get the data for Iron Man
labels=np.array(["Attack","Defense","Speed","Range","Health"])
stats=df.loc[0,labels].values

# Make some calculations for the plot
angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False)
stats=np.concatenate((stats,[stats[0]]))
angles=np.concatenate((angles,[angles[0]]))

# Plot stuff
fig=plt.figure()
ax=fig.add_subplot(111, polar=True)
ax.plot(angles, stats, 'o-', linewidth=2)
ax.fill(angles, stats, alpha=0.25)
ax.set_thetagrids(angles *180/np.pi, labels)
ax.set_title([df.loc[0,"Name"]])
ax.grid(True)

plt.show()
Copier après la connexion

Diagramme en arbre

Nous utilisons des diagrammes en arbre depuis l'école primaire. Les diagrammes en arbre sont naturels, intuitifs et faciles à expliquer. Les nœuds avec des connexions directes sont étroitement liés et très différents des nœuds avec plusieurs connexions. Dans l'image ci-dessous, j'ai tracé une petite partie de l'ensemble de données

Pokémon avec statistiques de Kaggle :

HP, Attaque, Défense, Attaque spéciale, Défense spéciale, Vitesse

因此,与stats wise最匹配的Pokemon将紧密连接在一起。例如,我们看到,在顶部,Arbok和Fearow是直接连接的,而且,如果我们查看数据,Arbok总共有438个,而Fearow有442个,非常接近。但是一旦我们移动到Raticate,我们得到的总数是413,这与Arbok和Fearow的差别很大,这就是它们被分开的原因。当我们移动树的时候,基于相似性,Pokemon被分的组越来越多。在绿色组中的Pokemon相互之间比红色组中的更相似,即使没有直接的绿色连接。

Introduction à quatre méthodes de visualisation de données Python (avec exemples)

对于树形图,我们实际上要使用Scipy的。在查看了数据集之后,我们将去掉字符串类型的列。我们这么做只是为了要得到正确的可视化结果,但在实践中,最好是把这些字符串转换成分类变量,为了得到更好的结果和进行比较,我们还设置了数据帧索引,以便能够适当地用它作为引用每个节点的列。最后,在Scipy中计算和绘制树形图是非常简单的事了。

# Import libs
import pandas aspd
frommatplotlibimportpyplotasplt
fromscipy.clusterimport hierarchy
importnumpyasnp
# Read in the dataset
# Drop any fields that are strings
# Only get the first 40 because this dataset is big
df=pd.read_csv('Pokemon.csv')
df=df.set_index('Name')
del df.index.name
df=df.drop(["Type 1", "Type 2", "Legendary"], axis=1)
df=df.head(n=40)
# Calculate the distance between each sample
Z =hierarchy.linkage(df, 'ward')
# Orientation our tree
hierarchy.dendrogram(Z, orientation="left", labels=df.index)
plt.show()
Copier après la connexion


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Peut-on exécuter le code sous Windows 8 Peut-on exécuter le code sous Windows 8 Apr 15, 2025 pm 07:24 PM

VS Code peut fonctionner sur Windows 8, mais l'expérience peut ne pas être excellente. Assurez-vous d'abord que le système a été mis à jour sur le dernier correctif, puis téléchargez le package d'installation VS Code qui correspond à l'architecture du système et l'installez comme invité. Après l'installation, sachez que certaines extensions peuvent être incompatibles avec Windows 8 et doivent rechercher des extensions alternatives ou utiliser de nouveaux systèmes Windows dans une machine virtuelle. Installez les extensions nécessaires pour vérifier si elles fonctionnent correctement. Bien que le code VS soit possible sur Windows 8, il est recommandé de passer à un système Windows plus récent pour une meilleure expérience de développement et une meilleure sécurité.

L'extension VScode est-elle malveillante? L'extension VScode est-elle malveillante? Apr 15, 2025 pm 07:57 PM

Les extensions de code vs posent des risques malveillants, tels que la cachette de code malveillant, l'exploitation des vulnérabilités et la masturbation comme des extensions légitimes. Les méthodes pour identifier les extensions malveillantes comprennent: la vérification des éditeurs, la lecture des commentaires, la vérification du code et l'installation avec prudence. Les mesures de sécurité comprennent également: la sensibilisation à la sécurité, les bonnes habitudes, les mises à jour régulières et les logiciels antivirus.

Choisir entre PHP et Python: un guide Choisir entre PHP et Python: un guide Apr 18, 2025 am 12:24 AM

PHP convient au développement Web et au prototypage rapide, et Python convient à la science des données et à l'apprentissage automatique. 1.Php est utilisé pour le développement Web dynamique, avec une syntaxe simple et adapté pour un développement rapide. 2. Python a une syntaxe concise, convient à plusieurs champs et a un écosystème de bibliothèque solide.

Comment exécuter des programmes dans Terminal Vscode Comment exécuter des programmes dans Terminal Vscode Apr 15, 2025 pm 06:42 PM

Dans VS Code, vous pouvez exécuter le programme dans le terminal via les étapes suivantes: Préparez le code et ouvrez le terminal intégré pour vous assurer que le répertoire de code est cohérent avec le répertoire de travail du terminal. Sélectionnez la commande Run en fonction du langage de programmation (tel que Python de Python your_file_name.py) pour vérifier s'il s'exécute avec succès et résoudre les erreurs. Utilisez le débogueur pour améliorer l'efficacité du débogage.

PHP et Python: différents paradigmes expliqués PHP et Python: différents paradigmes expliqués Apr 18, 2025 am 12:26 AM

PHP est principalement la programmation procédurale, mais prend également en charge la programmation orientée objet (POO); Python prend en charge une variété de paradigmes, y compris la POO, la programmation fonctionnelle et procédurale. PHP convient au développement Web, et Python convient à une variété d'applications telles que l'analyse des données et l'apprentissage automatique.

Le code Visual Studio peut-il être utilisé dans Python Le code Visual Studio peut-il être utilisé dans Python Apr 15, 2025 pm 08:18 PM

VS Code peut être utilisé pour écrire Python et fournit de nombreuses fonctionnalités qui en font un outil idéal pour développer des applications Python. Il permet aux utilisateurs de: installer des extensions Python pour obtenir des fonctions telles que la réalisation du code, la mise en évidence de la syntaxe et le débogage. Utilisez le débogueur pour suivre le code étape par étape, trouver et corriger les erreurs. Intégrez Git pour le contrôle de version. Utilisez des outils de mise en forme de code pour maintenir la cohérence du code. Utilisez l'outil de liaison pour repérer les problèmes potentiels à l'avance.

Peut-on utiliser pour mac Peut-on utiliser pour mac Apr 15, 2025 pm 07:36 PM

VS Code est disponible sur Mac. Il a des extensions puissantes, l'intégration GIT, le terminal et le débogueur, et offre également une multitude d'options de configuration. Cependant, pour des projets particulièrement importants ou un développement hautement professionnel, le code vs peut avoir des performances ou des limitations fonctionnelles.

Peut-on rescode exécuter ipynb Peut-on rescode exécuter ipynb Apr 15, 2025 pm 07:30 PM

La clé de l'exécution du cahier Jupyter dans VS Code est de s'assurer que l'environnement Python est correctement configuré, de comprendre que l'ordre d'exécution du code est cohérent avec l'ordre cellulaire et d'être conscient des fichiers volumineux ou des bibliothèques externes qui peuvent affecter les performances. Les fonctions d'achèvement et de débogage du code fournies par VS Code peuvent considérablement améliorer l'efficacité du codage et réduire les erreurs.

See all articles