Comptage de fréquence efficace pour les valeurs uniques dans les tableaux NumPy
Pour un comptage de fréquence efficace des valeurs uniques dans un tableau NumPy, envisagez d'utiliser numpy.unique avec l'option return_counts=True, notamment pour les versions NumPy 1.9 et supérieures. Cette approche fournit à la fois des valeurs uniques et leurs comptes respectifs.
<code class="python">import numpy as np x = np.array([1,1,1,2,2,2,5,25,1,1]) unique, counts = np.unique(x, return_counts=True) print(np.asarray((unique, counts)).T) # Output in tuple format</code>
Cette approche surpasse scipy.stats.itemfreq en termes d'efficacité, comme démontré ci-dessous :
<code class="python">x = np.random.random_integers(0,100,1e6) %timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms %timeit scipy.stats.itemfreq(x) # 170 ms</code>
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!