Im Datensatz wird die Stärke und Richtung der Korrelation zwischen zwei Variablenpaaren grafisch über eine Korrelations-Heatmap dargestellt, die die Korrelationsmatrix veranschaulicht. Es handelt sich um eine effektive Technik zum Auffinden von Mustern und Zusammenhängen in großen Datensätzen.
Das Python-Datenvisualisierungstool Seaborn bietet einfache Tools zum Generieren statistischer Visualisierungsgrafiken. Durch die Möglichkeit, Korrelations-Heatmaps zu erstellen, können Benutzer die Korrelationsmatrix eines Datensatzes schnell anzeigen.
Wir müssen den Datensatz importieren, die Korrelationsmatrix der Variablen berechnen und dann die Heatmap-Funktion von Seaborn verwenden, um die Heatmap zu generieren und die Korrelations-Heatmap zu erstellen. Eine Heatmap zeigt eine Matrix an, deren Farben den Grad der Korrelation zwischen Variablen darstellen. Darüber hinaus können Benutzer Korrelationskoeffizienten auf Heatmaps anzeigen.
Seaborn Correlation Heatmap ist eine effektive Visualisierungstechnik zur Untersuchung von Mustern und Beziehungen in einem Datensatz und kann verwendet werden, um Schlüsselvariablen für weitere Untersuchungen zu lokalisieren.
Die Heatmap-Funktion generiert eine farbcodierte Matrix, die die Stärke der Korrelation zwischen zwei Variablenpaaren im Datensatz veranschaulicht. Für die Heatmap-Funktion müssen wir die Korrelationsmatrix der Variablen bereitstellen, die mit der Corr-Methode des Pandas-Datenrahmens berechnet werden kann. Die Heatmap-Funktion bietet eine Reihe optionaler Optionen, mit denen der Benutzer die visuellen Effekte der Heatmap ändern kann, einschließlich Farbschema, Anmerkung, Diagrammgröße und -position.
import seaborn as sns sns.heatmap(data, cmap=None, annot=None)
Die Parameterdaten in der obigen Funktion sind die Korrelationsmatrix, die den Eingabedatensatz darstellt. Die zum Einfärben von Heatmaps verwendete Farbkarte wird cmap genannt.
Die chinesische Übersetzung vonIn diesem Beispiel erstellen wir mit Python eine Seaborn-Korrelations-Heatmap. Zuerst importieren wir die Seaborn- und Matplotlib-Bibliotheken und laden den Iris-Datensatz mit der Funktion „Datensatz laden“ von Seaborn. Dieser Datensatz enthält die Variablen SepalLength, SepalWidth, PetalLength und PetalWidth. Der Irisdatensatz umfasst Messungen der Kelchblattlänge, Kelchblattbreite, Blütenblattlänge und Blütenblattbreite von Irisblüten. Hier ist ein Beispiel für eine Nachricht -
Seriennummer | Kegelblattlänge | sepal_width | Blütenblattlänge | Blütenblattbreite | Arten | |
---|---|---|---|---|---|---|
0 | 5.1 | Die chinesische Übersetzung von3.5 | lautet:3.5 | 1.4 | 0,2 | Seidenglatt |
1 | 4.9 | 3.0 | 1.4 | 0,2 | Seidenglatt | |
2 | 4.7 | 3.2 | 1.3 | 0,2 | Seidenglatt | |
3 | 4.6 | wird übersetzt als:4.6 | 3.1 | 1,5 | 0,2 | Seidenglatt |
4 | 5.0 | Ins Chinesische übersetzt:5.0 | 3,6 | 1.4 | 0,2 | Seidenglatt |
Benutzer können die Methode „Datensatz laden“ von Seaborn verwenden, um den Irisdatensatz in einen Pandas DataFrame zu laden. Die Korrelationsmatrix der Variablen wird dann mithilfe der corr-Methode des Pandas-Datenrahmens berechnet und in einer Variablen namens corr_matrix gespeichert. Wir verwenden die Heatmap-Methode von Seaborn, um Heatmaps zu erstellen. Wir übergeben die Korrelationsmatrix corr_matrix an die Funktion und setzen den cmap-Parameter auf „coolwarm“, um unterschiedliche Farben zur Darstellung positiver und negativer Korrelationen zu verwenden. Schließlich verwenden wir die Show-Methode des Pyplot-Moduls von Matplotlib, um die Heatmap anzuzeigen.
# Required libraries import seaborn as sns import matplotlib.pyplot as plt # Load the iris dataset into a Pandas dataframe iris_data = sns.load_dataset('iris') # Creating the correlation matrix of the iris dataset iris_corr_matrix = iris_data.corr() print(iris_corr_matrix) # Create the heatmap using the `heatmap` function of Seaborn sns.heatmap(iris_corr_matrix, cmap='coolwarm', annot=True) # Display the heatmap using the `show` method of the `pyplot` module from matplotlib. plt.show()
sepal_length sepal_width petal_length petal_width sepal_length 1.000000 -0.117570 0.871754 0.817941 sepal_width -0.117570 1.000000 -0.428440 -0.366126 petal_length 0.871754 -0.428440 1.000000 0.962865 petal_width 0.817941 -0.366126 0.962865 1.000000
In diesem Beispiel verwenden wir erneut Python, um eine seegeborene Korrelations-Heatmap zu erstellen. Zuerst importieren wir die Seaborn- und Matplotlib-Bibliotheken und laden den Diamantdatensatz mit der Funktion „Datensatz laden“ von Seaborn. Der Diamantendatensatz enthält detaillierte Informationen zu den Kosten und Eigenschaften von Diamanten, einschließlich Karatgewicht, Schliff, Farbe und Reinheit. Dies ist ein Beispiel für Informationen −
Seriennummer | Karat | Die chinesische Übersetzung voncut | ist:cut | Farbe | Klarheit | Die chinesische Übersetzung vonTiefe | lautet:Tiefe | Tisch | Preis | x | y | z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 0,23 | Ideal | wird übersetzt als:Ideal | E | SI2 | 61,5 | 55.0 | Ins Chinesische übersetzt:55.0 | 326 | Die chinesische Übersetzung von3,95 | lautet:3,95 | 3,98 | 2,43 |
1 | 0,21 | Premium-Version | E | SI1 | 59,8 | 61,0 | 326 | 3,89 | 3,84 | 2.31 | |||
2 | 0,23 | Gut | E | VS1 | 56,9 | 65,0 | 327 | 4.05 | 4.07 | 2.31 | |||
3 | 0,29 | Premium-Version | Die chinesische Übersetzung vonI | ist:I | VS2 | Die chinesische Übersetzung von62.4 | lautet:62.4 | 58,0 | 334 | 4.20 | 4.23 | 2,63 | |
4 | 0,31 | Gut | J | SI2 | 63,3 | 58,0 | 335 | 4.34 | 4.35 | Die chinesische Übersetzung von2,75 | lautet:2,75 |
可以使用 Seaborn 的加载数据集函数将钻石数据集加载到 Pandas DataFrame 中。接下来,使用 Pandas 数据帧的 corr 方法,计算变量的相关矩阵并将其存储在名为 Diamond_corr_matrix 的变量中。为了利用不同的颜色来表示与函数的正相关和负相关,我们传递相关矩阵 corr 矩阵并将 cmap 选项设置为“coolwarm”。最后,我们使用 matplotlib 的 show 方法中的 pyplot 模块来显示热图。
# Required libraries import seaborn as sns import matplotlib.pyplot as plt # Load the diamond dataset into a Pandas dataframe diamonds_data = sns.load_dataset('diamonds') # Compute the correlation matrix of the variables diamonds_corr_matrix = diamonds_data.corr() print(diamonds_corr_matrix) # Create the heatmap using the `heatmap` function of Seaborn sns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True) # Display the heatmap using the `show` method of the `pyplot` module from matplotlib. plt.show()
carat depth table price x y z carat 1.000000 0.028224 0.181618 0.921591 0.975094 0.951722 0.953387 depth 0.028224 1.000000 -0.295779 -0.010647 -0.025289 -0.029341 0.094924 table 0.181618 -0.295779 1.000000 0.127134 0.195344 0.183760 0.150929 price 0.921591 -0.010647 0.127134 1.000000 0.884435 0.865421 0.861249 x 0.975094 -0.025289 0.195344 0.884435 1.000000 0.974701 0.970772 y 0.951722 -0.029341 0.183760 0.865421 0.974701 1.000000 0.952006 z 0.953387 0.094924 0.150929 0.861249 0.970772 0.952006 1.000000
热图是一种有益的图形表示形式,seaborn 使其变得简单易用。
Das obige ist der detaillierte Inhalt vonWie erstelle ich eine Seaborn-Korrelations-Heatmap in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!