


Introduction à quatre méthodes de visualisation de données Python (avec exemples)
Cet article vous présente une introduction à quatre méthodes de visualisation de données en Python (avec des exemples). Il a une certaine valeur de référence. Les amis dans le besoin pourront s'y référer.
Résumé : Cet article décrit quatre méthodes de visualisation de données Python : carte thermique, carte de densité bidimensionnelle, carte en araignée et carte arborescente.
La visualisation des données est une partie importante de tout projet de science des données ou d'apprentissage automatique. Les gens commencent souvent par une analyse exploratoire des données (EDA) pour mieux comprendre leurs données, et la création de visualisations peut vraiment aider à rendre les problèmes plus clairs et plus faciles à comprendre, en particulier pour les ensembles de données plus volumineux et de grande dimension. À la fin d'un projet, il est important de pouvoir présenter le résultat final de manière claire, concise et convaincante que vos utilisateurs puissent comprendre et comprendre.
Vous avez peut-être lu mon article précédent "5 visualisations de données rapides et faciles en Python avec Code" , qui présente 5 méthodes de visualisation de base : nuages de points, graphiques linéaires, histogrammes, diagrammes à barres et diagrammes en boîte. . Ces cinq méthodes de visualisation sont simples mais puissantes avec lesquelles vous pouvez certainement tirer d’énormes gains de vos ensembles de données. Dans cet article, nous présenterons 4 autres méthodes de visualisation de données, mais elles sont légèrement plus compliquées. Vous pouvez les utiliser après avoir lu les méthodes de base présentées dans l'article précédent.
Carte thermique
Une carte thermique est une représentation matricielle de données, où chaque valeur matricielle est représentée par une couleur. Différentes couleurs représentent différents niveaux et l'index matriciel relie deux colonnes ou caractéristiques contrastées. Les cartes thermiques sont idéales pour montrer les relations entre plusieurs variables de caractéristiques, car un niveau peut être visualisé directement sous forme de couleur. Vous pouvez également voir comment chaque relation se compare aux autres relations de l'ensemble de données en examinant certains points de la carte thermique. Les couleurs fournissent une représentation simple car très intuitive.# Importing libs importseaborn as sns import pandas aspd importnumpyasnp importmatplotlib.pyplotasplt # Create a random dataset data=pd.DataFrame(np.random.random((10,6)), columns=["Iron Man","CaptainAmerica","BlackWidow","Thor","Hulk", "Hawkeye"]) print(data) # Plot the heatmap heatmap_plot=sns.heatmap(data, center=0, cmap='gist_ncar') plt.show()
2D Density Plot (2D Density Plot)
Le 2D Density Plot est une simple extension de la version unidimensionnelle qui vous permet de voir la relation distribution de probabilité entre deux variables. Regardons le tracé de densité 2D ci-dessous. L'échelle de droite représente la probabilité de chaque point en couleur. La probabilité la plus élevée, en regardant l'ensemble de données, semble être d'environ 0,5 en taille et 1,4 en vitesse. Comme vous pouvez le constater, les tracés de densité 2D sont parfaits pour déterminer rapidement les zones de données les plus concentrées pour deux variables, plutôt que pour une seule variable comme les tracés de densité 1D. Les tracés de densité bidimensionnels sont particulièrement utiles lorsque vous disposez de deux variables importantes pour le résultat et que vous souhaitez comprendre comment elles contribuent ensemble à la distribution du résultat.Spider Plot
Spider Plot est l'un des meilleurs moyens d'afficher des relations un-à-plusieurs. Autrement dit, vous pouvez tracer et afficher les valeurs de plusieurs variables par opposition à une seule variable ou catégorie. Dans un diagramme en araignée, les propriétés d’une variable par rapport à une autre sont évidentes car l’aire et la longueur varient dans certaines directions. Si vous souhaitez voir comment les variables se superposent pour plusieurs catégories, tracez-les côte à côte. Dans l'image ci-dessous, il est facile de comparer les différents attributs de trois personnages de films et de voir où se situent leurs points forts !# Import libs import pandas aspd importseabornassns importnumpyasnp importmatplotlib.pyplotasplt # Get the data df=pd.read_csv("avengers_data.csv") print(df) """ # Name Attack Defense Speed Range Health 0 1 Iron Man 83 80 75 70 70 1 2 Captain America 60 62 63 80 80 2 3 Thor 80 82 83 100 100 3 3 Hulk 80 100 67 44 92 4 4 Black Widow 52 43 60 50 65 5 5 Hawkeye 58 64 58 80 65 """ # Get the data for Iron Man labels=np.array(["Attack","Defense","Speed","Range","Health"]) stats=df.loc[0,labels].values # Make some calculations for the plot angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False) stats=np.concatenate((stats,[stats[0]])) angles=np.concatenate((angles,[angles[0]])) # Plot stuff fig=plt.figure() ax=fig.add_subplot(111, polar=True) ax.plot(angles, stats, 'o-', linewidth=2) ax.fill(angles, stats, alpha=0.25) ax.set_thetagrids(angles *180/np.pi, labels) ax.set_title([df.loc[0,"Name"]]) ax.grid(True) plt.show()
Diagramme en arbre
Nous utilisons des diagrammes en arbre depuis l'école primaire. Les diagrammes en arbre sont naturels, intuitifs et faciles à expliquer. Les nœuds avec des connexions directes sont étroitement liés et très différents des nœuds avec plusieurs connexions. Dans l'image ci-dessous, j'ai tracé une petite partie de l'ensemble de donnéesPokémon avec statistiques de Kaggle :
HP, Attaque, Défense, Attaque spéciale, Défense spéciale, Vitesse因此,与stats wise最匹配的Pokemon将紧密连接在一起。例如,我们看到,在顶部,Arbok和Fearow是直接连接的,而且,如果我们查看数据,Arbok总共有438个,而Fearow有442个,非常接近。但是一旦我们移动到Raticate,我们得到的总数是413,这与Arbok和Fearow的差别很大,这就是它们被分开的原因。当我们移动树的时候,基于相似性,Pokemon被分的组越来越多。在绿色组中的Pokemon相互之间比红色组中的更相似,即使没有直接的绿色连接。
对于树形图,我们实际上要使用Scipy的。在查看了数据集之后,我们将去掉字符串类型的列。我们这么做只是为了要得到正确的可视化结果,但在实践中,最好是把这些字符串转换成分类变量,为了得到更好的结果和进行比较,我们还设置了数据帧索引,以便能够适当地用它作为引用每个节点的列。最后,在Scipy中计算和绘制树形图是非常简单的事了。
# Import libs import pandas aspd frommatplotlibimportpyplotasplt fromscipy.clusterimport hierarchy importnumpyasnp # Read in the dataset # Drop any fields that are strings # Only get the first 40 because this dataset is big df=pd.read_csv('Pokemon.csv') df=df.set_index('Name') del df.index.name df=df.drop(["Type 1", "Type 2", "Legendary"], axis=1) df=df.head(n=40) # Calculate the distance between each sample Z =hierarchy.linkage(df, 'ward') # Orientation our tree hierarchy.dendrogram(Z, orientation="left", labels=df.index) plt.show()
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

VS Code peut fonctionner sur Windows 8, mais l'expérience peut ne pas être excellente. Assurez-vous d'abord que le système a été mis à jour sur le dernier correctif, puis téléchargez le package d'installation VS Code qui correspond à l'architecture du système et l'installez comme invité. Après l'installation, sachez que certaines extensions peuvent être incompatibles avec Windows 8 et doivent rechercher des extensions alternatives ou utiliser de nouveaux systèmes Windows dans une machine virtuelle. Installez les extensions nécessaires pour vérifier si elles fonctionnent correctement. Bien que le code VS soit possible sur Windows 8, il est recommandé de passer à un système Windows plus récent pour une meilleure expérience de développement et une meilleure sécurité.

Les extensions de code vs posent des risques malveillants, tels que la cachette de code malveillant, l'exploitation des vulnérabilités et la masturbation comme des extensions légitimes. Les méthodes pour identifier les extensions malveillantes comprennent: la vérification des éditeurs, la lecture des commentaires, la vérification du code et l'installation avec prudence. Les mesures de sécurité comprennent également: la sensibilisation à la sécurité, les bonnes habitudes, les mises à jour régulières et les logiciels antivirus.

PHP convient au développement Web et au prototypage rapide, et Python convient à la science des données et à l'apprentissage automatique. 1.Php est utilisé pour le développement Web dynamique, avec une syntaxe simple et adapté pour un développement rapide. 2. Python a une syntaxe concise, convient à plusieurs champs et a un écosystème de bibliothèque solide.

Dans VS Code, vous pouvez exécuter le programme dans le terminal via les étapes suivantes: Préparez le code et ouvrez le terminal intégré pour vous assurer que le répertoire de code est cohérent avec le répertoire de travail du terminal. Sélectionnez la commande Run en fonction du langage de programmation (tel que Python de Python your_file_name.py) pour vérifier s'il s'exécute avec succès et résoudre les erreurs. Utilisez le débogueur pour améliorer l'efficacité du débogage.

PHP est principalement la programmation procédurale, mais prend également en charge la programmation orientée objet (POO); Python prend en charge une variété de paradigmes, y compris la POO, la programmation fonctionnelle et procédurale. PHP convient au développement Web, et Python convient à une variété d'applications telles que l'analyse des données et l'apprentissage automatique.

VS Code peut être utilisé pour écrire Python et fournit de nombreuses fonctionnalités qui en font un outil idéal pour développer des applications Python. Il permet aux utilisateurs de: installer des extensions Python pour obtenir des fonctions telles que la réalisation du code, la mise en évidence de la syntaxe et le débogage. Utilisez le débogueur pour suivre le code étape par étape, trouver et corriger les erreurs. Intégrez Git pour le contrôle de version. Utilisez des outils de mise en forme de code pour maintenir la cohérence du code. Utilisez l'outil de liaison pour repérer les problèmes potentiels à l'avance.

VS Code est disponible sur Mac. Il a des extensions puissantes, l'intégration GIT, le terminal et le débogueur, et offre également une multitude d'options de configuration. Cependant, pour des projets particulièrement importants ou un développement hautement professionnel, le code vs peut avoir des performances ou des limitations fonctionnelles.

La clé de l'exécution du cahier Jupyter dans VS Code est de s'assurer que l'environnement Python est correctement configuré, de comprendre que l'ordre d'exécution du code est cohérent avec l'ordre cellulaire et d'être conscient des fichiers volumineux ou des bibliothèques externes qui peuvent affecter les performances. Les fonctions d'achèvement et de débogage du code fournies par VS Code peuvent considérablement améliorer l'efficacité du codage et réduire les erreurs.
