Filtrage efficace des DataFrames et séries Pandas
Le filtrage des données dans les DataFrames et séries Pandas est essentiel pour la manipulation et l'analyse des données. Pour appliquer efficacement plusieurs filtres, envisagez de tirer parti des opérateurs intégrés et de l'indexation booléenne de Pandas.
Pour un DataFrame ou une série, fournir une opération et une liste de valeurs dans un format de dictionnaire, comme indiqué dans l'exemple ci-dessous :
<code class="python">relops = {'>=': [1], '<=': [1]}
Pour appliquer ces filtres :
<code class="python">import numpy as np def boolean_filter(x, relops): filters = [] for op, vals in relops.items(): op_func = getattr(np, op) for val in vals: filters.append(op_func(x, val)) return x[(np.logical_and(*filters))] ## Example: df = pandas.DataFrame({'col1': [0, 1, 2], 'col2': [10, 11, 12]}) result = boolean_filter(df['col1'], {'>=': [1]}) print(result) ## Output: # col1 # 1 1 # 2 2 # Name: col1</code>
En utilisant l'indexation booléenne, cette méthode évite les copies inutiles et est très efficace, en particulier pour les grands ensembles de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!