Python et MySql : Unicode et encodage
Gestion d'Unicode dans un contexte de base de données et Python
Lorsque vous travaillez avec des données Unicode, il est crucial de gérer correctement leur encodage dans la base de données et dans le code Python. Les caractères Unicode peuvent provoquer des erreurs d'encodage s'ils ne sont pas traités correctement, comme le montre la question présentée.
Gestion d'Unicode du côté de la base de données
Une approche consiste à modifier la base de données MySQL table pour prendre en charge le codage Unicode. Pour ce faire, vous pouvez modifier les colonnes concernées pour utiliser le codage de caractères UTF-8. Par exemple, la colonne "question_subj" de la table "yahoo_questions" peut être modifiée comme :
ALTER TABLE yahoo_questions MODIFY COLUMN question_subj VARCHAR(255) CHARACTER SET utf8 COLLATE utf8_general_ci;
Gestion d'Unicode du côté Python
Alternativement, vous pouvez gérer l'encodage Unicode en Python avant d'envoyer les données à MySQL. Cela implique d'encoder les données en UTF-8 avant de les insérer dans la base de données.
Dans l'extrait de code Python fourni, la bibliothèque MySQLdb est utilisée pour se connecter à la base de données. Lors de la connexion, vous pouvez spécifier le paramètre charset='utf8' pour vous assurer que la bibliothèque utilise l'encodage UTF-8 :
db = MySQLdb.connect(**db_config, charset='utf8')
De plus, lors de l'insertion de données, vous devez explicitement encoder les données en UTF-8 en utilisant la fonction encode() :
cur.execute("INSERT INTO yahoo_questions (question_subj, question_content, ...) VALUES (%s, %s, ...)", (row[5].encode('utf8'), row[6].encode('utf8'), ...))
En gérant l'encodage Unicode de manière appropriée, soit du côté de la base de données, soit du côté Python, vous pouvez résoudre l'erreur Unicode et garantir insertion et récupération appropriées des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!