Cet article explore une méthode efficace pour calculer les décomptes de fréquence de valeurs uniques dans un tableau NumPy.
Utiliser numpy.unique avec return_counts=True (pour les versions NumPy 1.9 et supérieures) permet un calcul efficace des valeurs uniques et de leurs décomptes correspondants. À titre d'illustration :
<code class="python">import numpy as np x = np.array([1,1,1,2,2,2,5,25,1,1]) unique, counts = np.unique(x, return_counts=True) print(np.asarray((unique, counts)).T)</code>
Cette approche surpasse considérablement la fonction scipy.stats.itemfreq en termes de vitesse d'exécution, comme le démontrent les benchmarks de performances :
<code class="python">In [4]: x = np.random.random_integers(0,100,1e6) In [5]: %timeit unique, counts = np.unique(x, return_counts=True) 10 loops, best of 3: 31.5 ms per loop In [6]: %timeit scipy.stats.itemfreq(x) 10 loops, best of 3: 170 ms per loop</code>
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!