Comprendre les paires de substitution en Java
Lors de l'examen de la documentation StringBuffer, en particulier de la méthode reverse(), vous pouvez rencontrer le terme « paires de substitution ". Ce concept joue un rôle crucial dans la représentation des caractères au-delà de la plage des unités de code UTF-16 typiques.
Qu'est-ce qu'une paire de substitution ?
Une paire de substitution est une technique utilisé dans le codage Unicode pour représenter les caractères avec des points de code supérieurs à 0xFFFF. Dans le schéma UTF-16, ces caractères sont codés à l'aide d'une paire d'unités de code de 16 bits.
Surrogates faibles et élevés
Les unités de code de substitution se répartissent en deux catégories : substituts faibles et substituts élevés.
Un caractère avec un point de code dépassant 0xFFFF est représenté par un substitut élevé suivi d'un substitut faible. Le substitut haut représente les bits les plus significatifs (MSB) du point de code du caractère, tandis que le substitut bas représente les bits les moins significatifs (LSB).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!