Obtenez le nombre de caractères multi-octets avant la correspondance avec preg_match() (le paramètre PREG_OFFSET_CAPTURE compte inutilement les octets)
Dans les chaînes encodées en UTF-8, preg_match () peut signaler des décalages de caractères incorrects dans les correspondances capturées lors de l'utilisation du paramètre PREG_OFFSET_CAPTURE. La raison en est que les décalages capturés sont comptés en octets, même lorsque la chaîne sujet est interprétée comme UTF-8 avec le modificateur "u".
Solution :
Pour obtenir les décalages de caractères corrects dans les correspondances capturées UTF-8, utilisez mb_strlen pour calculer le nombre de caractères en fonction de l'octet UTF-8. compensations :
$str = "\xC2\xA1Hola!"; preg_match('/H/u', $str, $a_matches, PREG_OFFSET_CAPTURE); echo mb_strlen(substr($str, 0, $a_matches[0][1]));
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!