Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV à l'aide de Pandas ?-Tutoriel Python-php.cn

Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV à l'aide de Pandas ?

Linda Hamilton

Libérer： 2024-11-02 18:05:29

original

687 Les gens l'ont consulté

How to Skip Specific Rows When Importing CSV Files Using Pandas?

Comment importer des fichiers CSV avec des lignes ignorées à l'aide de Pandas

L'importation de fichiers CSV dans Python est une tâche courante, et Pandas est une bibliothèque populaire pour manipuler et analyser des données. Cependant, vous pouvez rencontrer des situations dans lesquelles vous devez ignorer des lignes spécifiques pendant le processus d'importation.

Pour y parvenir, Pandas fournit le paramètre skiprows dans sa fonction read_csv(). Cependant, la documentation peut paraître ambiguë, vous laissant vous demander comment spécifier correctement les lignes à ignorer.

Comprendre le paramètre skiprows

Le paramètre skiprows accepte soit une liste de numéros de ligne (indexés à 0) ou un nombre entier représentant le nombre de lignes à ignorer depuis le début du fichier. La confusion survient car Pandas autorise les deux interprétations, selon le format de la valeur que vous fournissez.

Liste des numéros de ligne (par exemple, skiprows=[1]) : Ignore le lignes avec les indices spécifiés. Dans ce cas, skiprows=[1] sauterait la ligne avec l'index 1 (la deuxième ligne).
Entier (par exemple, skiprows=1) : Ignore les n premières lignes du fichier, où n est la valeur entière. Ainsi, skiprows=1 ignorerait la première ligne.

Exemple

Pour illustrer la différence, considérons le fichier CSV suivant :

<code class="csv">1, 2
3, 4
5, 6</code>

Copier après la connexion

Pour ignorer la deuxième ligne (avec l'index 1) :

<code class="python">import pandas as pd

# Skip row with index 1
data = pd.read_csv("data.csv", skiprows=[1])

# Print the data
print(data)</code>

Copier après la connexion

Cela afficherait :

   0  1
0  1  2
1  5  6

Copier après la connexion

Pour ignorer la première ligne :

<code class="python">import pandas as pd

# Skip first row
data = pd.read_csv("data.csv", skiprows=1)

# Print the data
print(data)</code>

Copier après la connexion

Cela afficherait :

   0  1
0  3  4
1  5  6

Copier après la connexion

En comprenant les différentes manières de spécifier les lignes ignorées dans Pandas.read_csv(), vous pouvez importer efficacement des données et gérer des scénarios spécifiques dans lesquels l'exclusion de certaines lignes est requise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!