Maison > développement back-end > Tutoriel Python > Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV avec Pandas ?

Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV avec Pandas ?

Susan Sarandon
Libérer: 2024-11-02 13:57:03
original
209 Les gens l'ont consulté

How to Skip Specific Rows When Importing CSV Files with Pandas?

Interprétation de l'argument Skip Rows de Pandas pour les importations CSV

Lors de l'importation d'un fichier CSV dans un DataFrame à l'aide de pandas.read_csv(), vous pouvez vous rencontrez des situations dans lesquelles vous souhaitez exclure des lignes spécifiques du processus d'importation. L'argument skiprows offre cette fonctionnalité, mais sa syntaxe peut être ambiguë.

Comprendre l'ambiguïté

La documentation pandas indique que les skiprows peuvent accepter soit une liste de numéros de ligne ( indexé 0) ou un nombre entier représentant le nombre de lignes à ignorer depuis le début du fichier. Cette ambiguïté peut prêter à confusion lorsque l'on souhaite sauter une ligne spécifique, comme celle d'index 1.

Déterminer le comportement

Pour clarifier le comportement des skiprows , envisagez les scénarios suivants :

  • skiprows=1 : cet argument ignorera la première ligne du fichier CSV, pas la ligne avec l'index 1.
  • skiprows=[1] : Cet argument ignorera spécifiquement la ligne avec l'index 1.

Exemple de démonstration

Illustrons le comportement en utilisant un objet StringIO :

<code class="python">import pandas as pd
from io import StringIO

s = "1, 2\n3, 4\n5, 6"

# Skipping the first row
df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None)

# Skipping the row with index 1
df2 = pd.read_csv(StringIO(s), skiprows=1, header=None)

print(df1)
print(df2)</code>
Copier après la connexion

Sortie :

   0  1
0  1  2
1  5  6

   0  1
0  3  4
1  5  6
Copier après la connexion

Comme vous pouvez le voir, skiprows=[1] ignore la deuxième ligne (index 1), tandis que skiprows=1 ignore la première ligne.

Conclusion

Pour ignorer une ligne spécifique lors des importations CSV à l'aide de pandas.read_csv(), utilisez la syntaxe skiprows=[row_index]. Cette syntaxe spécifie sans équivoque la ligne à exclure du processus d'importation, éliminant ainsi toute confusion sur le comportement de l'argument.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal