Comment résoudre le problème php substr tronqué

小云云
Libérer: 2023-03-17 11:02:02
original
3641 Les gens l'ont consulté

php substr est une fonction fonctionnelle développée sur la base du langage php qui peut renvoyer une partie d'une chaîne. Parfois, lorsque nous utilisons php substr, des caractères tronqués apparaissent. Comment le résoudre ?

string substr ( string $string , int $start [, int $length ] )
Copier après la connexion

Renvoie une chaîne de longueur commençant à la position de départ dans la chaîne

La fonction substr intercepte les caractères par octets. Les caractères chinois sont de 2 lorsqu'ils sont codés en GB2312 octets, l'encodage UTF-8 est. 3 octets, donc si les caractères chinois sont tronqués lors de l'interception d'une chaîne de longueur spécifiée, le résultat renvoyé sera tronqué lors de l'affichage.

Après vérification, les solutions peuvent être résumées en deux catégories :

1. Utilisez plutôt la fonction mb_substr()

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )
Copier après la connexion

Similaire à la fonction substr(. ), en comptant simplement par le nombre de caractères pour garantir la sécurité des caractères

L'utilisation de la fonction mb_substr() peut garantir qu'il n'y aura pas de caractères tronqués, mais l'inconvénient est que les statistiques de longueur deviennent à la place le nombre de caractères du nombre d'octets. Lorsqu'il est utilisé pour l'affichage, il y aura une grande différence dans la longueur d'affichage entre les résultats chinois et les résultats anglais de même longueur.

2. Fonction auto-construite pour améliorer la fonction substr

Voici une fonction qui peut mieux résoudre le problème de la rencontre des caractères chinois par substr. Les caractères chinois sont calculés en 2 unités de longueur, de sorte que la longueur d'affichage finale des résultats d'interception de chaîne dans un environnement mixte chinois et anglais soit proche ; le dernier caractère incomplet est ignoré pour garantir qu'il n'y aura pas de caractères tronqués sur l'écran ; il est compatible avec l'UTF couramment utilisé pour l'encodage des caractères chinois -8 et l'encodage GB2312 a une bonne polyvalence.

Afficher le code source

  function getstr($string, $length, $encoding  = 'utf-8') {    
 $string = trim($string);    
 if($length && strlen($string) > $length) {    
  //截断字符    
  $wordscut = '';    
  if(strtolower($encoding) == 'utf-8') {    
  //utf8编码    
   $n = 0;    
  $tn = 0;    
 $noc = 0;    
 while ($n < strlen($string)) {    
  $t = ord($string[$n]);    
 if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {    
 $tn = 1;    
 $n++;    
  $noc++;    
 } elseif(194 <= $t && $t <= 223) {    
 $tn = 2;    
 $n += 2;    
} elseif(224 <= $t && $t < 239) {    
  $tn = 3;    
  $n += 3;    
  $noc += 2;    
 } elseif(240 <= $t && $t <= 247) {    
 $tn = 4;    
 $n += 4;    
 $noc += 2;    
 } elseif(248 <= $t && $t <= 251) {    
  $tn = 5;    
$n += 5;    
   $noc += 2;    
 } elseif($t == 252 || $t == 253) {    
 $tn = 6;    
   $n += 6;    
   $noc += 2;    
  } else {    
 $n++;    
}    
 if ($noc >= $length) {    
break;    
 }    
}    
 if ($noc > $length) {    
$n -= $tn;    
  }    
 $wordscut = substr($string, 0, $n);    
 } else {    
 for($i = 0; $i < $length - 1; $i++) {    
  if(ord($string[$i]) > 127) {    
$wordscut .= $string[$i].$string[$i + 1];    
$i++;    
 } else {    
   $wordscut .= $string[$i];    
  }    
 }    
  }    
$string = $wordscut;    
 }    
return trim($string);    
 }    
 // 示例    
 echo getstr("0一二三四五六七",1).&#39;<br />&#39;;  // 0    
 echo getstr("0一二三四五六七",2).&#39;<br />&#39;;  // 0    
echo getstr("0一二三四五六七",3).&#39;<br />&#39;;  // 0一    
 echo getstr("0一二三四五六七",4).&#39;<br />&#39;;  // 0一    
 echo getstr("0一二三四五六七",5).&#39;<br />&#39;;  // 0一二    
 echo getstr("0一a二b三四五六七",1).&#39;<br />&#39;;    // 0    
  echo getstr("0一a二b三四五六七",2).&#39;<br />&#39;;    // 0    
 echo getstr("0一a二b三四五六七",3).&#39;<br />&#39;;    // 0一    
 echo getstr("0一a二b三四五六七",4).&#39;<br />&#39;;    // 0一a    
  echo getstr("0一a二b三四五六七",5).&#39;<br />&#39;;    // 0一a
Copier après la connexion

Cette fonction est modifiée à partir de la fonction getstr() dans UCHome 1.5.

Ce qui précède est la solution pour résoudre le problème des caractères tronqués de php substr. Nous avons également partagé une série d'articles sur la fonction php substr auparavant. Si vous en avez besoin, vous pouvez faire attention à PHP. Site chinois.

Recommandations associées :

Quelques programmes sur la fonction PHP substr()

Explication chinoise détaillée du traitement de la fonction php substr()

Explication sur l'utilisation de l'interception de chaîne de fonction php substr()


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!