## Wie kann man Häufigkeitszahlen für unterschiedliche Werte in NumPy-Arrays effizient berechnen?

Susan Sarandon
Freigeben: 2024-10-27 10:55:30
Original
232 Leute haben es durchsucht

## How to Efficiently Calculate Frequency Counts for Distinct Values in NumPy Arrays?

Berechnen der Häufigkeitszahlen für unterschiedliche Werte in NumPy-Arrays

Das Ermitteln der Häufigkeit des Auftretens einzelner Werte innerhalb eines NumPy-Arrays ist eine häufige Aufgabe bei der Datenanalyse. Dieser Artikel beschreibt einen effizienten Ansatz zum Erhalten dieser Häufigkeitszahlen.

Methode:

Die primäre Methode zum Erhalten von Häufigkeitszahlen in NumPy ist insbesondere die Funktion np.unique durch Setzen von return_counts=True. Betrachten Sie zum Beispiel das folgende Array:

<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>
Nach dem Login kopieren

Um die Häufigkeitsanzahl dieser Elemente zu berechnen:

<code class="python">import numpy as np

unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>
Nach dem Login kopieren

Dies wird Folgendes ausgeben:

[[ 1  5]
 [ 2  3]
 [ 5  1]
 [25  1]]
Nach dem Login kopieren

Wie Sie Wie Sie sehen können, enthält das resultierende Array die eindeutigen Werte (in der ersten Spalte) und ihre jeweiligen Häufigkeiten (in der zweiten Spalte).

Vergleich und Leistung:

Die Die np.unique-Methode mit return_counts=True bietet eine verbesserte Leistung im Vergleich zu anderen Ansätzen, wie z. B. scipy.stats.itemfreq. Bei großen Arrays reduziert sich der Zeitaufwand von np.unique deutlich, wie der folgende Benchmark-Vergleich zeigt:

<code class="python">x = np.random.random_integers(0,100,1e6)

%timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop

%timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>
Nach dem Login kopieren

Fazit:

Der np.unique Die Funktion in NumPy bietet eine effiziente Lösung zum Ermitteln der Häufigkeitsanzahl eindeutiger Werte in einem Array. Sein Leistungsvorteil gegenüber alternativen Methoden macht es zur bevorzugten Wahl für große Datensätze.

Das obige ist der detaillierte Inhalt von## Wie kann man Häufigkeitszahlen für unterschiedliche Werte in NumPy-Arrays effizient berechnen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!