Ein Histogramm ist eine grafische Darstellung der Verteilung eines Datensatzes. Es stellt Daten in Form einer Reihe von Balkendiagrammen dar, wobei jeder Balken einen Bereich von Datenwerten darstellt und die Höhe des Balkens die Häufigkeit der innerhalb dieses Bereichs definierten Datenwerte darstellt.
Diese werden hauptsächlich verwendet, um die Verteilung numerischer Daten darzustellen, wie z. B. die Verteilung der Noten in einer Klasse, die Bevölkerungsverteilung oder die Einkommensverteilung der Arbeitnehmer usw.
Im Histogramm stellt die x-Achse den Bereich der Datenwerte dar, unterteilt in Intervalle, und die y-Achse stellt die Häufigkeit des Bereichs der Datenwerte innerhalb jedes Bins dar. Histogramme können normalisiert werden, indem die Häufigkeit jedes Bins durch dividiert wird Gesamtdatenwerte, was zum Histogramm der relativen Häufigkeit führt, wobei die Y-Achse die Datenwerte jedes Bins darstellt.
In Python haben wir zum Erstellen der Histogramme die Bibliotheken Numpy, Matplotlib und Seaborn. In Numpy haben wir die Funktion histogram(), um mit den Histogrammdaten zu arbeiten.
Im Folgenden finden Sie die Syntax zum Erstellen der Histogramme für den angegebenen Datenbereich.
numpy.histogram(arr, bins, range, normed, weights, density)
Where,
ist:Where,
arr ist das Eingabearray
bins ist die Anzahl der Balken im Histogramm, die zur Darstellung von Daten
Bereich definiert den Wertebereich im Histogramm
normierter Präferenzdichteparameter
weights ist ein optionaler Parameter für die Gewichtung jedes Datenwerts
Dichte ist ein Parameter, der die Histogrammdaten in eine Wahrscheinlichkeitsdichte normalisiert.
Die Ausgabe der Histogrammfunktion ist ein Tupel, das die Histogrammzählungen und Bin-Kanten enthält.
Im folgenden Beispiel erstellen wir ein Histogramm mit der Funktion histogram() von Numpy. Hier nehmen wir ein Array als Eingabeparameter und definieren Bins als 10, sodass das Histogramm mit 10 Bins erstellt wird und die restlichen Parameter als keine beibehalten werden können.
import numpy as np arr = np.array([10,20,25,40,35,23]) hist = np.histogram(arr,bins = 10) print("The histogram created:",hist)
The histogram created: (array([1, 0, 0, 1, 1, 1, 0, 0, 1, 1], dtype=int64), array([10., 13., 16., 19., 22., 25., 28., 31., 34., 37., 40.]))
Sehen wir uns ein Beispiel an, um die histogram()-Funktion der Numpy-Bibliothek zu verstehen.
import numpy as np arr = np.array([[20,20,25],[40,35,23],[34,22,1]]) hist = np.histogram(arr,bins = 20) print("The histogram created:",hist)
The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 2, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1], dtype=int64), array([ 1. , 2.95, 4.9 , 6.85, 8.8 , 10.75, 12.7 , 14.65, 16.6 , 18.55, 20.5 , 22.45, 24.4 , 26.35, 28.3 , 30.25, 32.2 , 34.15, 36.1 , 38.05, 40. ]))</p><p>
In diesem Beispiel erstellen wir ein Histogramm, indem wir die zu verwendenden Bins und den Datenbereich angeben. Der folgende Code kann als Referenz verwendet werden.
import numpy as np arr = np.array([[20,20,25],[40,35,23],[34,22,1]]) hist = np.histogram(arr,bins = 20, range = (1,10)) print("The histogram created:", hist)
The histogram created: (array([1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0], dtype=int64), array([ 1. , 1.45, 1.9 , 2.35, 2.8 , 3.25, 3.7 ,4.15, 4.6 , 5.05, 5.5 , 5.95, 6.4 , 6.85, 7.3 , 7.75, 8.2 , 8.65, 9.1 , 9.55, 10. ]))
Das obige ist der detaillierte Inhalt vonBerechnen Sie ein Histogramm eines Datensatzes mit NumPy in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!