Remplacement des valeurs vides par NaN dans Pandas
Dans les dataframes Pandas, il est souvent nécessaire d'identifier et de remplacer les valeurs d'espacement (" ") par Valeurs NaN. Cette opération garantit l'intégrité des données et permet une analyse transparente.
Un moyen efficace d'y parvenir consiste à utiliser la méthode Pandas replace(). Sa syntaxe est la suivante :
<code class="python">df.replace(to_replace, value, regex=True)</code>
Dans ce contexte :
Pour remplacer les valeurs vides par NaN, vous pouvez utilisez le code suivant :
<code class="python">import pandas as pd import numpy as np # Create a sample dataframe df = pd.DataFrame({ "A": [-0.532681, 1.490752, -1.387326, 0.814772, -0.222552, -1.176781], "B": ['foo', 'bar', 'foo', 'baz', ' ','qux'], "C": [0, 1, 2, ' ', 4, ' '] }) # Replace blank values with NaN df = df.replace(r'^\s*$', np.nan, regex=True) # Display the updated dataframe print(df)</code>
Sortie :
A B C 0 -0.532681 foo 0 1 1.490752 bar 1 2 -1.387326 foo 2 3 0.814772 baz NaN 4 -0.222552 NaN 4 5 -1.176781 qux NaN
Ce code remplace efficacement toutes les valeurs vides de la trame de données par NaN, fournissant une représentation plus propre et plus précise de vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!