Saut de lignes lors de l'importation CSV avec Pandas
Lorsque vous utilisez pandas.read_csv() pour importer des données CSV, vous souhaiterez peut-être ignorer certaines lignes . Cependant, le paramètre skiprows peut prêter à confusion, car il accepte à la fois une liste et un entier.
Le paramètre skiprows vous permet de spécifier les lignes à ignorer depuis le début du fichier. Si vous fournissez une liste de numéros de lignes, ces lignes seront ignorées. Si vous fournissez un nombre entier, ce nombre de lignes sera ignoré.
Par exemple, si vous avez un fichier CSV dont la deuxième ligne contient des données inutiles et que vous souhaitez l'ignorer, vous pouvez utiliser l'un des éléments suivants méthodes :
Sauter sous forme de liste (recommandé)
<code class="python">import pandas as pd from io import StringIO s = """1, 2 3, 4 5, 6""" # Skip the second row using a list df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Output: Row with index 1 skipped print(df)</code>
Sauter sous forme d'entier
<code class="python"># Skip the second row using an integer df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Output: Row with index 1 skipped print(df)</code>
Remarque que l'utilisation de skiprows=1 ignore la première ligne, tandis que skiprows=[1] ignore la ligne avec l'index 1. En effet, Python utilise une indexation basée sur 0, où le premier élément d'une liste a l'index 0.
Conclusion
En comprenant le comportement du paramètre skiprows, vous pouvez efficacement ignorer les lignes indésirables lors de l'importation CSV à l'aide de pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!