Table des matières
1. Problèmes d'encodage des fichiers XML dans Python
2. 处理 Python XML 文件的思路
Maison développement back-end Tutoriel Python Comment convertir l'encodage des fichiers XML en Python

Comment convertir l'encodage des fichiers XML en Python

May 21, 2023 pm 12:22 PM
python xml

1. Problèmes d'encodage des fichiers XML dans Python

1. La bibliothèque xml.etree.ElementTree utilisée par Python prend uniquement en charge l'analyse et la génération d'encodage au format UTF-8 standardxml.etree.ElementTree库只支持解析和生成标准的UTF-8格式的编码

2.常见GBKGB2312等中文编码的 XML 文件,用以在老旧系统中保证 XML 对中文字符的记录能力

3.XML 文件开头有标识头,标识头指定了程序处理 XML 时应该使用的编码

Comment convertir lencodage des fichiers XML en Python

4.要修改编码,不仅要修改文件整体的编码,还要将标识头中 encoding 部分的值修改

2. 处理 Python XML 文件的思路

1.读取&解码:

  • 使用二进制模式读取 XML 文件,将文件变为二进制流

  • 将二进制流使用.encode()方法,使用原文件的编码格式进行解析为字符串

2.处理标识头:使用.replace()方法,替换字符串中的encoding="xxx"

2. GBK ou GB2312 et d'autres fichiers XML codés en chinois sont utilisés pour garantir la capacité de XML à enregistrer des caractères chinois dans les anciens systèmes

3. Il y a un en-tête au début du XML. L'en-tête spécifie l'encodage que le programme doit utiliser lors du traitement de XML

Comment. pour analyser XML en Python Convertir l'encodage du fichier
  • 4. Pour modifier l'encodage, non seulement l'encodage de l'ensemble du fichier doit être modifié, mais aussi la valeur de la partie encodage dans l'en-tête doit être modifiée

    2. Idées pour traiter les fichiers XML Python
  • 1. Lire Récupérer et décoder :

    • Utilisez le mode binaire pour lire le fichier XML et transformer le fichier en flux binaire
    • Utilisez le flux binaire pour utiliser le .encode() et utilisez le format d'encodage du fichier d'origine. Analysez en une chaîne
    • 2. Traitez l'en-tête d'identification : utilisez la méthode .replace(). pour remplacer la partie encoding="xxx" dans la chaîne
    • 3. Encodage et sauvegarde : Enregistrez la chaîne en utilisant le nouveau format d'encodage

    • 3. Problèmes rencontrés dans le processus réel
  • GB2312. UTF : Pas de problème, vous pouvez le gérer directement selon la logique ci-dessus

GBK
  • Le principe ici est : l'encodage GBK est compatible avec l'encodage UTF-8, donc le contenu qui ne peut pas être converti peut être affiché directement à l'aide de GBK

  • GBK < ;–> : pas de problème

🎜4. 🎜
# filepath -- 原文件路径
# savefilepath -- 转换后文件存储路径(默认 = 原文件路径)
# oldencoding -- 原文件的编码格式
# newencoding -- 转换后文件的编码格式
def convert_xml_encoding(filepath, savefilepath=filepath, oldencoding, newencoding):
    # Read the XML file
    with open(filepath, &#39;rb&#39;) as file:
        content = file.read()

    # Decode the content from old encoding
    # 出现错误时忽略 errors=&#39;ignore&#39;
    decoded_content = content.decode(oldencoding, errors=&#39;ignore&#39;)
    # decoded_content = content.decode(&#39;GBK&#39;)


    # Update the encoding in the XML header
    updated_content = decoded_content.replace(&#39;encoding="{}"&#39;.format(oldencoding),
                                               &#39;encoding="{}"&#39;.format(newencoding))

    # Encode the content to new encoding
    # 出现错误时忽略 errors=&#39;ignore&#39;
    encoded_content = updated_content.encode(newencoding,errors=&#39;ignore&#39;)

    # Write the updated content to the file
    with open(savefilepath, &#39;wb&#39;) as file:
        file.write(encoded_content)

    # Result output
    print(f"XML file &#39;{os.path.basename(filepath)}&#39;({oldencoding}) --> &#39;{os.path.basename(savefilepath)}&#39;({newencoding})")

# ---------------------- 使用示例 ---------------------
# GBK --> utf-8
convert_xml_encoding(filepath, savefilepath2, &#39;GBK&#39;, &#39;utf-8&#39;)
# utf-8 --> gb2312
convert_xml_encoding(filepath, savefilepath2, &#39;utf-8&#39;, &#39;gb2312&#39;)
# GBK --> gb2312
convert_xml_encoding(filepath, savefilepath2, &#39;GBK&#39;, &#39;gb2312&#39;)
Copier après la connexion
🎜Remarques :🎜🎜🎜🎜Étant donné que l'en-tête du logo doit être remplacé directement ici, le nom d'encodage doit correspondre complètement, sinon le remplacement échouera🎜 🎜🎜🎜Par exemple : GBK ne peut pas être écrit comme gbk, utf-8 ne peut pas être écrit en UTF8. Ce code est uniquement testé sur la base des formats GBK, GB2312, UTF-8 ci-dessus et du chinois et de l'anglais couramment utilisés. Il n'est pas garanti que la conversion soit réussie.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

PHP et Python: exemples de code et comparaison PHP et Python: exemples de code et comparaison Apr 15, 2025 am 12:07 AM

PHP et Python ont leurs propres avantages et inconvénients, et le choix dépend des besoins du projet et des préférences personnelles. 1.Php convient au développement rapide et à la maintenance des applications Web à grande échelle. 2. Python domine le domaine de la science des données et de l'apprentissage automatique.

Python vs JavaScript: communauté, bibliothèques et ressources Python vs JavaScript: communauté, bibliothèques et ressources Apr 15, 2025 am 12:16 AM

Python et JavaScript ont leurs propres avantages et inconvénients en termes de communauté, de bibliothèques et de ressources. 1) La communauté Python est amicale et adaptée aux débutants, mais les ressources de développement frontal ne sont pas aussi riches que JavaScript. 2) Python est puissant dans les bibliothèques de science des données et d'apprentissage automatique, tandis que JavaScript est meilleur dans les bibliothèques et les cadres de développement frontaux. 3) Les deux ont des ressources d'apprentissage riches, mais Python convient pour commencer par des documents officiels, tandis que JavaScript est meilleur avec MDNWEBDOCS. Le choix doit être basé sur les besoins du projet et les intérêts personnels.

Comment est la prise en charge du GPU pour Pytorch sur Centos Comment est la prise en charge du GPU pour Pytorch sur Centos Apr 14, 2025 pm 06:48 PM

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

Explication détaillée du principe docker Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

Comment faire fonctionner la formation distribuée de Pytorch sur CentOS Comment faire fonctionner la formation distribuée de Pytorch sur CentOS Apr 14, 2025 pm 06:36 PM

La formation distribuée par Pytorch sur le système CentOS nécessite les étapes suivantes: Installation de Pytorch: La prémisse est que Python et PIP sont installés dans le système CentOS. Selon votre version CUDA, obtenez la commande d'installation appropriée sur le site officiel de Pytorch. Pour la formation du processeur uniquement, vous pouvez utiliser la commande suivante: pipinstalltorchtorchVisionTorChaudio Si vous avez besoin d'une prise en charge du GPU, assurez-vous que la version correspondante de CUDA et CUDNN est installée et utilise la version Pytorch correspondante pour l'installation. Configuration de l'environnement distribué: la formation distribuée nécessite généralement plusieurs machines ou des GPU multiples uniques. Lieu

Comment choisir la version Pytorch sur Centos Comment choisir la version Pytorch sur Centos Apr 14, 2025 pm 06:51 PM

Lors de l'installation de Pytorch sur le système CentOS, vous devez sélectionner soigneusement la version appropriée et considérer les facteurs clés suivants: 1. Compatibilité de l'environnement du système: Système d'exploitation: Il est recommandé d'utiliser CentOS7 ou plus. CUDA et CUDNN: La version Pytorch et la version CUDA sont étroitement liées. Par exemple, Pytorch1.9.0 nécessite CUDA11.1, tandis que Pytorch2.0.1 nécessite CUDA11.3. La version CUDNN doit également correspondre à la version CUDA. Avant de sélectionner la version Pytorch, assurez-vous de confirmer que des versions compatibles CUDA et CUDNN ont été installées. Version Python: branche officielle de Pytorch

Python: automatisation, script et gestion des tâches Python: automatisation, script et gestion des tâches Apr 16, 2025 am 12:14 AM

Python excelle dans l'automatisation, les scripts et la gestion des tâches. 1) Automatisation: La sauvegarde du fichier est réalisée via des bibliothèques standard telles que le système d'exploitation et la fermeture. 2) Écriture de script: utilisez la bibliothèque PSUTIL pour surveiller les ressources système. 3) Gestion des tâches: utilisez la bibliothèque de planification pour planifier les tâches. La facilité d'utilisation de Python et la prise en charge de la bibliothèque riche en font l'outil préféré dans ces domaines.

Comment mettre à jour Pytorch vers la dernière version sur Centos Comment mettre à jour Pytorch vers la dernière version sur Centos Apr 14, 2025 pm 06:15 PM

La mise à jour de Pytorch vers la dernière version sur CentOS peut suivre les étapes suivantes: Méthode 1: Mise à jour de PIP avec PIP: Assurez-vous d'abord que votre PIP est la dernière version, car les anciennes versions de PIP peuvent ne pas être en mesure d'installer correctement la dernière version de Pytorch. pipinstall-upradepip désinstalle ancienne version de Pytorch (si installé): PipuninstallTorchtorchVisiontorchaudio installation dernier

See all articles