Les
fonctions courantes pour calculer la longueur de la chaîne en php incluent : strlen et mb_strlen Lorsque les caractères sont tous des caractères anglais, les deux sont identiques. Ici, nous comparons principalement les deux résultats de calcul lorsque le chinois et l'anglais sont mélangés.
En PHP, strlen et mb_strlen sont des fonctions permettant de trouver la longueur d'une chaîne.
La fonction strlen() renvoie la longueur de la chaîne. En cas de succès, elle renvoie la longueur de la chaîne. Si la chaîne est vide, 0 est renvoyé.
mb_strlen — Obtenez la longueur de la chaîne,
Syntaxe
mb_strlen ($str, $encoding)
str La chaîne pour vérifier la longueur.
encodage Le paramètre est l'encodage des caractères. En cas d'omission, le codage de caractères interne est utilisé.
Valeur de retour
Renvoie le nombre de caractères contenus dans la chaîne str avec encoding encoding. Les caractères multi-octets comptent pour 1.
Renvoie FALSE si l'encodage donné n'est pas valide.
Ce qui suit utilise des exemples pour expliquer la différence entre les deux.
Regardez d'abord l'exemple :
<?php //测试时文件的编码方式要是UTF8 $str='中文a字1符'; echo strlen($str).'<br>';//14 echo mb_strlen($str,'utf8').'<br>';//6 echo mb_strlen($str,'gbk').'<br>';//8 echo mb_strlen($str,'gb2312').'<br>';//10 ?>
Analyse des résultats : Lors du calcul de strlen, un caractère chinois UTF8 est traité comme 3 longueurs, donc la longueur de "Chinois un caractère 1 caractère" Il s'agit de 3*4+2=14. Lors du calcul de mb_strlen, si le code interne est sélectionné comme UTF8, un caractère chinois sera calculé comme une longueur de 1, donc la longueur du "Caractère chinois 1 caractère" est de 6 .
En utilisant ces deux fonctions, vous pouvez calculer conjointement l'occupation d'une chaîne mixte chinoise et anglaise (l'occupation d'un caractère chinois est 2, et l'occupation d'un caractère anglais est 1)
echo (strlen($str) + mb_strlen($str,'UTF8')) / 2;
Par exemple " La valeur strlen($str) de "Chinois un caractère 1 caractère" est 14, et la valeur mb_strlen($str) est 6. On peut calculer que l'espace réservé de "Chinois un caractère 1 caractère" " est 10.
echo mb_internal_encoding();
La fonction de longueur de chaîne intégrée de PHP, strlen, ne peut pas gérer correctement les chaînes chinoises. Elle obtient uniquement le nombre d'octets occupés par la chaîne. Pour l'encodage chinois GB2312, la valeur obtenue par strlen est le double du nombre de caractères chinois, tandis que pour le chinois encodé en UTF-8, la différence est de trois fois (sous l'encodage UTF-8, un caractère chinois occupe 3 octets).
L'utilisation de la fonction mb_strlen peut mieux résoudre ce problème. L'utilisation de mb_strlen est similaire à strlen, sauf qu'il possède un deuxième paramètre facultatif pour spécifier le codage des caractères. Par exemple, pour obtenir la longueur de la chaîne UTF-8 $str, vous pouvez utiliser mb_strlen($str,'UTF-8'). Si le deuxième paramètre est omis, l'encodage interne de PHP sera utilisé. L'encodage interne peut être obtenu via la fonction mb_internal_encoding().
Il convient de noter que mb_strlen n'est pas une fonction principale de PHP Avant de l'utiliser, vous devez vous assurer que php_mbstring.dll est chargé dans php.ini, c'est-à-dire assurez-vous que "extension=php_mbstring.dll" Une ligne existe et n'est pas commentée, sinon un problème de fonction non défini se produira.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!