Comment réparer « pandas.parser.CParserError : erreur de tokenisation des données » de Pandas dans les fichiers CSV ?-Tutoriel Python-php.cn

Comment réparer « pandas.parser.CParserError : erreur de tokenisation des données » de Pandas dans les fichiers CSV ?

Barbara Streisand

Libérer： 2024-12-21 10:26:09

original

354 Les gens l'ont consulté

How to Fix Pandas'

Comment résoudre « pandas.parser.CParserError : erreur de tokenisation des données » lors de la lecture d'un fichier CSV

Lorsque vous travaillez avec un fichier CSV à l'aide Pandas, vous pouvez rencontrer l'erreur « pandas.parser.CParserError : erreur de tokenisation des données ». Cette erreur spécifique se produit lorsque le fichier CSV comporte un nombre inégal de champs dans une ligne, provoquant une erreur d'analyse.

Comprendre la cause :

Le message d'erreur indique que l'analyseur s'attendait à deux champs dans une ligne particulière mais en a trouvé 12 à la place. Cette inadéquation entre le nombre attendu et réel de champs entraîne l'erreur.

Résoudre le problème :

Il existe deux manières principales de résoudre ce problème :

Gérer le mal Lignes :
- on_bad_lines='skip' : Cette option demande à Pandas d'ignorer les lignes incriminées contenant des données non valides, vous permettant de lire le reste du fichier sans erreurs. .
- on_bad_lines='warn' : Cette option génère des avertissements pour les lignes invalides, indiquant leur présence et permettant d’évaluer l’ampleur du problème. Pour une gestion avancée, vous pouvez transmettre une fonction appelable.
Gestion des erreurs :
- error_bad_lines=False : (pour les versions Pandas inférieures à 1.3.0) Cette option supprime l'erreur entièrement, vous permettant de lire l'intégralité du fichier, y compris les lignes invalides. Cependant, il ne fournit aucune information sur les lignes invalides.

Exemple de code :

À titre d'exemple, si vous aviez le code suivant :

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path)

Copier après la connexion

Pour gérer l'erreur, vous pouvez modifier le code comme suit :

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path, on_bad_lines='skip')

Copier après la connexion

En utilisant l'une de ces approches, vous pouvez lire le fichier CSV malgré la présence de lignes invalides, garantissant ainsi le bon déroulement de vos opérations Pandas

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!