pandas.parser.CParserError : Erreur de tokenisation des données
Problème :
Lors de la tentative de manipulez un fichier .csv avec Pandas, vous rencontrez ce qui suit erreur :
pandas.parser.CParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 12
Résolution possible :
Une solution potentielle à ce problème consiste à utiliser le paramètre on_bad_lines lors de l'appel de pd.read_csv() :
data = pd.read_csv('GOOG Key Ratios.csv', on_bad_lines='skip')
En définissant on_bad_lines sur « skip », Pandas ignorera toutes les lignes qu'il ne peut pas analyser et continuera le traitement. les lignes restantes. Cette approche est utile si vous pouvez tolérer la perte de certaines lignes incorrectes.
Si vous préférez gérer les lignes non valides différemment, par exemple en affichant un avertissement ou en déclenchant une exception, vous pouvez fournir une fonction appelable personnalisée au paramètre on_bad_lines. Pour plus d'informations sur la gestion des lignes mal formées, reportez-vous à la documentation Pandas.
Remarque :
Pour les versions Pandas antérieures à 1.3.0, vous pouvez utiliser le paramètre error_bad_lines pour obtenir le même résultat :
data = pd.read_csv("GOOG Key Ratios.csv", error_bad_lines=False)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!