Interception personnalisée php des chaînes chinoises-version utf8
Plage d'encodage UTF-8 (utf-8 utilise 1 à 6 octets pour encoder les caractères, mais n'utilise en réalité que 1 à 4 octets) :
1个字节:00——7F 2个字节:C080——DFBF 3个字符:E08080——EFBFBF 4个字符:F0808080——F7BFBFBF
$str = 'abcd我是中国人'; echo strlen($str), '<br/>'; echo mstrlen($str), '<br/>'; echo msubstr($str, 3, 9); /** * 统计utf8下字符串长度 */ function mstrlen($str) { $len = 0; $i = 0; $slen = strlen($str); while ($i < $slen) { $o = ord($str[$i]); if ($o < 127) { $i++; } elseif ($o < 224) { $i+=2; } else { $i+=3; } $len++; } return $len; } /** * 截取utf8编码下的字符串 */ function msubstr($str, $start, $length) { $len = mstrlen($str); if($start < 0) { $start += $len; if($start < 0) { $start = 0; } } $slen = strlen($str); $index = 0; for ($i = 0; $i<$start && $i<$slen; $i++) { $o = ord($str[$index]); if ($o < 127) { $index++; }elseif ($o < 224) { $index+=2; } else { $index +=3; } } $length+=$index; $newStr = ''; for ($i = $index; $i < $length && $i<$slen; $i++) { $o = ord($str[$i]); if ($o < 127) { $newStr .= $str[$i]; } elseif ($o < 224) { $newStr .= substr($str, $i, 2); $i+=1; $length++; } else { $newStr .= substr($str, $i, 3); $i+=2; $length+=2; } } return $newStr; }
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!