## Comment calculer efficacement les décomptes de fréquence pour des valeurs distinctes dans les tableaux NumPy ?

Susan Sarandon
Libérer: 2024-10-27 10:55:30
original
232 Les gens l'ont consulté

## How to Efficiently Calculate Frequency Counts for Distinct Values in NumPy Arrays?

Calcul des fréquences pour des valeurs distinctes dans des tableaux NumPy

Trouver la fréquence d'occurrence de valeurs individuelles dans un tableau NumPy est une tâche courante dans l'analyse des données. Cet article décrit une approche efficace pour obtenir ces décomptes de fréquence.

Méthode :

La principale méthode pour obtenir des décomptes de fréquence dans NumPy consiste à utiliser la fonction np.unique, en particulier en définissant return_counts=True. Par exemple, considérons le tableau suivant :

<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>
Copier après la connexion

Pour calculer la fréquence de ces éléments :

<code class="python">import numpy as np

unique, counts = np.unique(x, return_counts=True)

print(np.asarray((unique, counts)).T)</code>
Copier après la connexion

Cela affichera :

[[ 1  5]
 [ 2  3]
 [ 5  1]
 [25  1]]
Copier après la connexion

Comme vous peut voir, le tableau résultant contient les valeurs uniques (dans la première colonne) et leurs fréquences respectives (dans la deuxième colonne).

Comparaison et performances :

Le La méthode np.unique avec return_counts=True offre des performances améliorées par rapport à d'autres approches, telles que scipy.stats.itemfreq. Pour les grands tableaux, le temps nécessaire à np.unique est considérablement réduit, comme le démontre la comparaison de référence suivante :

<code class="python">x = np.random.random_integers(0,100,1e6)

%timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop

%timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>
Copier après la connexion

Conclusion :

Le np.unique La fonction NumPy fournit une solution efficace pour obtenir le nombre de fréquences de valeurs uniques dans un tableau. Son avantage en termes de performances par rapport aux méthodes alternatives en fait un choix privilégié pour les grands ensembles de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!