L'importation de fichiers CSV dans Python est une tâche courante, et Pandas est une bibliothèque populaire pour manipuler et analyser des données. Cependant, vous pouvez rencontrer des situations dans lesquelles vous devez ignorer des lignes spécifiques pendant le processus d'importation.
Pour y parvenir, Pandas fournit le paramètre skiprows dans sa fonction read_csv(). Cependant, la documentation peut paraître ambiguë, vous laissant vous demander comment spécifier correctement les lignes à ignorer.
Comprendre le paramètre skiprows
Le paramètre skiprows accepte soit une liste de numéros de ligne (indexés à 0) ou un nombre entier représentant le nombre de lignes à ignorer depuis le début du fichier. La confusion survient car Pandas autorise les deux interprétations, selon le format de la valeur que vous fournissez.
Exemple
Pour illustrer la différence, considérons le fichier CSV suivant :
<code class="csv">1, 2 3, 4 5, 6</code>
Pour ignorer la deuxième ligne (avec l'index 1) :
<code class="python">import pandas as pd # Skip row with index 1 data = pd.read_csv("data.csv", skiprows=[1]) # Print the data print(data)</code>
Cela afficherait :
0 1 0 1 2 1 5 6
Pour ignorer la première ligne :
<code class="python">import pandas as pd # Skip first row data = pd.read_csv("data.csv", skiprows=1) # Print the data print(data)</code>
Cela afficherait :
0 1 0 3 4 1 5 6
En comprenant les différentes manières de spécifier les lignes ignorées dans Pandas.read_csv(), vous pouvez importer efficacement des données et gérer des scénarios spécifiques dans lesquels l'exclusion de certaines lignes est requise.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!