communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > Tutoriel Python > Comment la fonction `unicodedata.normalize()` de Python simplifie-t-elle les représentations Unicode ?

Comment la fonction `unicodedata.normalize()` de Python simplifie-t-elle les représentations Unicode ?

DDD

Libérer： 2024-11-22 16:12:15

original

324 Les gens l'ont consulté

How Does Python's `unicodedata.normalize()` Function Simplify Unicode Representations?

Normalisation d'Unicode en Python : simplification des représentations Unicode

En Python, le module unicodedata fournit la fonction .normalize() pour simplifier les représentations de chaînes Unicode . Cette fonction transforme les entités Unicode décomposées en leurs formes composites les plus simples.

Considérons l'exemple suivant :

import unicodedata

char = "á"
print(len(char))  # Output: 1

[print(unicodedata.name(c)) for c in char]  # Output: ['LATIN SMALL LETTER A WITH ACUTE']

char = "á"
print(len(char))  # Output: 2

[print(unicodedata.name(c)) for c in char]  # Output: ['LATIN SMALL LETTER A', 'COMBINING ACUTE ACCENT']

Copier après la connexion

Le caractère "á" est composé de deux points de code : U 0061 (LETTRE MINUSCULE LATINE A) et U 0301 (COMBINANT ACCENT AIGU). Décomposés, ces caractères apparaissent comme "á".

Pour normaliser cette chaîne, on peut utiliser .normalize('NFC'), qui renvoie la forme composée :

print(ascii(unicodedata.normalize('NFC', '\u0061\u0301')))  # Output: '\xe1'

Copier après la connexion

À l'inverse, . normalize('NFD') renvoie la forme décomposée :

print(ascii(unicodedata.normalize('NFD', '\u00E1')))  # Output: 'a\u0301'

Copier après la connexion

Des formes de normalisation supplémentaires existent pour gérer les points de code de compatibilité. NFKC et NFKD remplacent les caractères de compatibilité par leurs formes canoniques. Par exemple, U 2160 (CHIFFRE ROMAIN UN) se normalise en « I » en utilisant NFKC :

print(unicodedata.normalize('NFKC', '\u2167'))  # Output: 'VIII'

Copier après la connexion

Il est important de noter que la normalisation n'est pas toujours réversible, car certains caractères peuvent ne pas avoir de formes décomposées uniques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article précédent：Comment trouver les sous-classes d'une classe Python à l'aide de « __subclasses__ » ? Article suivant：Comment puis-je personnaliser les réponses aux erreurs pour des itinéraires spécifiques dans FastAPI ?

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Arctic Pablo Coin (APC) capte l'attention du marché avec sa structure de prévente unique

2025-03-16 11:28:16
Fanduel Promo Code offre 200 $ de bonus aux nouveaux utilisateurs

2025-03-16 11:24:16
Floppypepe (FPPE) est à l'avant-garde de l'évolution du marché des pièces meme

2025-03-16 11:22:16
Bitcoin, puis Ethereum et maintenant Avalanche, Solana et XRP: quel actif numérique n'a pas encore son ETF?

2025-03-16 11:20:16
Tokenomics for $ or, le jeton pour les donjons de cong de rpg de rôtre de Fantasy, ont officiellement été révélés

2025-03-16 11:16:16
John Squire prédit que tout le monde souhaite qu'ils aient acheté XRP d'ici 2030

2025-03-16 11:14:16
Les cybercriminels ont pu voler la crypto-monnaie d'une valeur de 1,5 milliard de dollars américains

2025-03-16 11:12:16
Les pièces MEME sont-elles toujours un investissement rentable?

2025-03-16 11:10:16
Google déploie largement les modèles Gemini 2.0 Flash Thinking (expérimentaux)

2025-03-16 11:08:16
Le lancement du Pakistan Crypto Council (PCC) pourrait annoncer une nouvelle ère d'innovation et de potentiel économique.

2025-03-16 11:06:16

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2978

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

3188

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

2597

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

2557

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

2588

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal