Fonctionnalité GroupBy dans NumPy
Le regroupement de données est une tâche courante dans l'analyse des données, vous permettant d'agréger et d'organiser des données en fonction de critères spécifiques. Bien que NumPy ne fournisse pas nativement de fonction de groupe par fonction dédiée, vous pouvez adopter plusieurs approches pour obtenir cette fonctionnalité.
Une méthode consiste à utiliser la fonction np.split() en combinaison avec np.unique() . Cette approche repose sur l'hypothèse que la première colonne de votre tableau, qui sert de clé de regroupement, est toujours croissante. En triant le tableau par cette colonne et en obtenant les valeurs uniques, vous pouvez ensuite diviser le tableau en groupes à l'aide de np.split().
Par exemple, étant donné le tableau suivant :
array([[1, 275], [1, 441], [1, 494], [1, 593], [2, 679], [2, 533], [2, 686], [3, 559], [3, 219], [3, 455], [4, 605], [4, 468], [4, 692], [4, 613]])
Pour regrouper ce tableau par la première colonne, vous pouvez utiliser le code suivant :
a = a[a[:, 0].argsort()] np.split(a[:,1], np.unique(a[:, 0], return_index=True)[1][1:])
Cela produira le résultat souhaité sortie :
array([[[275, 441, 494, 593]], [[679, 533, 686]], [[559, 219, 455]], [[605, 468, 692, 613]]], dtype=object)
Cette approche offre plusieurs avantages :
Bien que NumPy lui-même ne dispose pas d'un groupe par fonction spécifique, les méthodes décrites ci-dessus fournissent des moyens efficaces pour effectuer des opérations de regroupement sur vos données, vous permettant de les organiser et de les analyser efficacement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!