Comment résoudre « pandas.parser.CParserError : erreur de tokenisation des données » lors de la lecture d'un fichier CSV
Lorsque vous travaillez avec un fichier CSV à l'aide Pandas, vous pouvez rencontrer l'erreur « pandas.parser.CParserError : erreur de tokenisation des données ». Cette erreur spécifique se produit lorsque le fichier CSV comporte un nombre inégal de champs dans une ligne, provoquant une erreur d'analyse.
Comprendre la cause :
Le message d'erreur indique que l'analyseur s'attendait à deux champs dans une ligne particulière mais en a trouvé 12 à la place. Cette inadéquation entre le nombre attendu et réel de champs entraîne l'erreur.
Résoudre le problème :
Il existe deux manières principales de résoudre ce problème :
Gérer le mal Lignes :
Gestion des erreurs :
Exemple de code :
À titre d'exemple, si vous aviez le code suivant :
path = 'GOOG Key Ratios.csv' data = pd.read_csv(path)
Pour gérer l'erreur, vous pouvez modifier le code comme suit :
path = 'GOOG Key Ratios.csv' data = pd.read_csv(path, on_bad_lines='skip')
En utilisant l'une de ces approches, vous pouvez lire le fichier CSV malgré la présence de lignes invalides, garantissant ainsi le bon déroulement de vos opérations Pandas
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!