


Eine kurze Einführung in die Vorverarbeitung und Heatmaps in Python
Dieser Artikel bietet Ihnen eine kurze Einführung in die Vorverarbeitung und Heatmaps in Python. Ich hoffe, dass er für Freunde hilfreich ist.
Es gibt immer noch viele Dinge in der Datenanalyse. Nachdem ich diesen Aspekt verstanden habe, kann ich hoffen, dass dies für alle hilfreich ist.
Dieses Mal verwenden wir immer noch den Iris-Datensatz in sklearn und zeigen ihn über eine Heatmap an.
Vorverarbeitung
sklearn.preprocessing ist ein Vorverarbeitungsmodul in der Bibliothek für maschinelles Lernen, das die Daten standardisieren, regulieren usw. und je nach Bedarf verwenden kann. Hier wird seine standardisierte Methode zur Organisation der Daten verwendet. Andere Methoden können Sie selbst abfragen.
Standardisierung: Passen Sie die Verteilung der Merkmalsdaten an eine Standardnormalverteilung an, auch Gaußsche Verteilung genannt, was bedeutet, dass der Mittelwert der Daten 0 und die Varianz 1 beträgt.
Der Grund für die Standardisierung besteht darin, dass eine zu große Varianz einiger Merkmale die Zielfunktion dominiert und den Parameterschätzer daran hindert, andere Merkmale korrekt zu lernen.
Der Standardisierungsprozess besteht aus zwei Schritten: Dezentralisierung des Mittelwerts (der Mittelwert wird zu 0); Skalierung der Varianz (die Varianz wird zu 1).
stellt eine Skalierungsmethode in sklearn.preprocessing bereit, um die oben genannten Funktionen zu erreichen.
Nehmen wir ein Beispiel:
from sklearn import preprocessing import numpy as np # 创建一组特征数据,每一行表示一个样本,每一列表示一个特征 xx = np.array([[1., -1., 2.], [2., 0., 0.], [0., 1., -1.]]) # 将每一列特征标准化为标准正太分布,注意,标准化是针对每一列而言的 xx_scale = preprocessing.scale(xx) xx_scale
Das Ergebnis nach der Normalisierung der Daten in jeder Spalte ist:
array([[ 0. , -1.22474487, 1.33630621], [ 1.22474487, 0. , -0.26726124], [-1.22474487, 1.22474487, -1.06904497]])
Wie Sie sehen können, sind die darin enthaltenen Daten passiert. Die Änderungen, die Zahlenwerte sind relativ klein, vielleicht kann jemand es auf einen Blick erkennen, aber es macht nichts, wenn er es nicht sehen kann. Python kann einige seiner Statistiken leicht berechnen.
# 测试一下xx_scale每列的均值方差 print('均值:', xx_scale.mean(axis=0)) # axis=0指列,axis=1指行 print('方差:', xx_scale.std(axis=0))
Oben wurde bereits erläutert, in was die Standardisierung umgewandelt werden soll, und die Ergebnisse sind tatsächlich konsistent. Die Ergebnisse der Berechnung des Mittelwerts und der Varianz pro Spalte sind:
均值: [0. 0. 0.] 方差: [1. 1. 1.]
Natürlich für Standardisierung, Varianz und Mittelwert. Manchmal möchte man beispielsweise nur von einer der Methoden profitieren:
with_mean, with_std sind boolesche Parameter, die standardmäßig beide „true“ sind, aber auch auf „false“ angepasst werden können. Das bedeutet, dass die Varianz nicht zentriert oder nicht auf 1 skaliert werden soll >
Ich werde die Heatmap hier nur kurz erwähnen, da es im Internet bereits viele detaillierte Informationen dazu gibt. In einer Heatmap liegen die Daten in Form einer Matrix vor und der Attributbereich wird durch einen Farbverlauf dargestellt. Hier wird pcolor zum Zeichnen der Heatmap verwendet.
Little Lizi
Beginnen Sie mit der Importbibliothek, laden Sie dann den Datensatz, verarbeiten Sie die Daten, zeichnen Sie dann das Bild, machen Sie einige Anmerkungen und Dekorationen auf dem Bild usw. Ich bin es gewohnt, im Code Kommentare abzugeben. Wenn Sie etwas nicht verstehen, können Sie eine Nachricht hinterlassen und ich werde rechtzeitig antworten.
# 导入后续所需要的库 from sklearn.datasets import load_iris from sklearn.preprocessing import scale import numpy as np import matplotlib.pyplot as plt # 加载数据集 data = load_iris() x = data['data'] y = data['target'] col_names = data['feature_names'] # 数据预处理 # 根据平均值对数据进行缩放 x = scale(x, with_std=False) x_ = x[1:26,] # 选取其中25组数据 y_labels = range(1, 26) # 绘制热图 plt.close('all') plt.figure(1) fig, ax = plt.subplots() ax.pcolor(x_, cmap=plt.cm.Greens, edgecolors='k') ax.set_xticks(np.arange(0, x_.shape[1])+0.5) # 设置横纵坐标 ax.set_yticks(np.arange(0, x_.shape[0])+0.5) ax.xaxis.tick_top() # x轴提示显示在图形上方 ax.yaxis.tick_left() # y轴提示显示在图形的左侧 ax.set_xticklabels(col_names, minor=False, fontsize=10) # 传递标签数据 ax.set_yticklabels(y_labels, minor=False, fontsize=10) plt.show()
Wie sieht das gezeichnete Bild aus:
Nur ein paar einfache Schritte oben Ein intuitives Bild wird natürlich nicht so einfach sein, wenn es tatsächlich verwendet wird, und es muss mehr Wissen erweitert werden.
Das obige ist der detaillierte Inhalt vonEine kurze Einführung in die Vorverarbeitung und Heatmaps in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Python eignet sich für Datenwissenschafts-, Webentwicklungs- und Automatisierungsaufgaben, während C für Systemprogrammierung, Spieleentwicklung und eingebettete Systeme geeignet ist. Python ist bekannt für seine Einfachheit und sein starkes Ökosystem, während C für seine hohen Leistung und die zugrunde liegenden Kontrollfunktionen bekannt ist.

In diesem Artikel wird erläutert, wie die Leistung der Website verbessert wird, indem Apache -Protokolle im Debian -System analysiert werden. 1. Log -Analyse -Basics Apache Protokoll Datensätze Die detaillierten Informationen aller HTTP -Anforderungen, einschließlich IP -Adresse, Zeitstempel, URL, HTTP -Methode und Antwortcode. In Debian -Systemen befinden sich diese Protokolle normalerweise in /var/log/apache2/access.log und /var/log/apache2/error.log verzeichnis. Das Verständnis der Protokollstruktur ist der erste Schritt in der effektiven Analyse. 2. Tool mit Protokollanalyse Mit einer Vielzahl von Tools können Apache -Protokolle analysiert: Befehlszeilen -Tools: GREP, AWK, SED und andere Befehlszeilen -Tools.

Python zeichnet sich in Gaming und GUI -Entwicklung aus. 1) Spielentwicklung verwendet Pygame, die Zeichnungen, Audio- und andere Funktionen bereitstellt, die für die Erstellung von 2D -Spielen geeignet sind. 2) Die GUI -Entwicklung kann Tkinter oder Pyqt auswählen. Tkinter ist einfach und einfach zu bedienen. PYQT hat reichhaltige Funktionen und ist für die berufliche Entwicklung geeignet.

Der Vergleich zwischen Laravel und Python in der Entwicklungsumgebung und dem Ökosystem ist wie folgt: 1. Die Entwicklungsumgebung von Laravel ist einfach, nur PHP und Komponist sind erforderlich. Es bietet eine umfassende Auswahl an Erweiterungspaketen wie Laravelforge, aber die Wartung des Erweiterungspakets ist möglicherweise nicht rechtzeitig. 2. Die Entwicklungsumgebung von Python ist ebenfalls einfach, nur Python und PIP sind erforderlich. Das Ökosystem ist riesig und deckt mehrere Felder ab, aber das Versions- und Abhängigkeitsmanagement kann komplex sein.

PHP und Python haben jeweils ihre eigenen Vorteile und wählen nach den Projektanforderungen. 1.PHP ist für die Webentwicklung geeignet, insbesondere für die schnelle Entwicklung und Wartung von Websites. 2. Python eignet sich für Datenwissenschaft, maschinelles Lernen und künstliche Intelligenz mit prägnanter Syntax und für Anfänger.

In diesem Artikel wird die DDOS -Angriffserkennungsmethode erörtert. Obwohl kein direkter Antragsfall von "Debiansniffer" gefunden wurde, können die folgenden Methoden zur Erkennung von DDOS -Angriffsanfällen verwendet werden: Effektive DDOS -Angriffserkennungstechnologie: Erkennung auf der Grundlage der Verkehrsanalyse: Identifizierung von DDOS -Angriffen durch Überwachung abnormaler Muster des Netzwerkverkehrs, z. Beispielsweise können Python -Skripte in Kombination mit Pyshark- und Colorama -Bibliotheken den Netzwerkverkehr in Echtzeit überwachen und Warnungen ausstellen. Erkennung auf der Grundlage der statistischen Analyse: Durch Analyse statistischer Merkmale des Netzwerkverkehrs wie Daten

In diesem Artikel werden Sie begleitet, wie Sie Ihr NginXSSL -Zertifikat auf Ihrem Debian -System aktualisieren. Schritt 1: Installieren Sie zuerst CertBot und stellen Sie sicher, dass Ihr System Certbot- und Python3-CertBot-Nginx-Pakete installiert hat. If not installed, please execute the following command: sudoapt-getupdatesudoapt-getinstallcertbotpython3-certbot-nginx Step 2: Obtain and configure the certificate Use the certbot command to obtain the Let'sEncrypt certificate and configure Nginx: sudocertbot--nginx Follow the prompts to select

Die Readdir -Funktion im Debian -System ist ein Systemaufruf, der zum Lesen des Verzeichnisgehalts verwendet wird und häufig in der C -Programmierung verwendet wird. In diesem Artikel wird erläutert, wie Readdir in andere Tools integriert wird, um seine Funktionalität zu verbessern. Methode 1: Kombinieren Sie C -Sprachprogramm und Pipeline zuerst ein C -Programm, um die Funktion der Readdir aufzurufen und das Ergebnis auszugeben:#include#include#includeIntmain (intargc, char*argv []) {Dir*Dir; structDirent*Eintrag; if (argc! = 2) {{
