PHP は UTF8 または GBK でエンコードされた中国語と英語の文字列をインターセプトします
リリース: 2016-07-25 08:53:51
-
-
//String interception - $a = "s@@Hello";
- var_dump(strlen_weibo($a,'utf-8'));
- 結果 出力は 8 で、s が 1、全角 @ が 2、半角 @ が 1、漢字 2 文字が 4 と数えられます。ソースコードは以下の通りです:
//文字列をインターセプトする関数コード
- function strlen_weibo($string, $charset='utf-8')
- {
- $n = $count = 0 ;
- $ length = strlen($string);
- if (strto lower($charset) == 'utf-8')
- {
- while ($n < $length)
- {
- $currentByte = ord($string[ $n] );
- if ($currentByte == 9 ||
- $currentByte == 10 ||
- (32 <= $currentByte && $currentByte <= 126)) // bbs.it-home.org
- {
- $ n++;
- $count++;
- } elseif (194 <= $currentByte && $currentByte <= 223)
- {
- $n += 2;
- $count += 2;
- } elseif (224 <; = $currentByte && $currentByte <= 239)
- {
- $n += 3;
- $count += 2;
- } elseif (240 <= $currentByte && $currentByte <= 247)
- {
- $n += 4 ;
- $count += 2;
- } elseif (248 <= $currentByte && $currentByte <= 251)
- {
- $n += 5;
- $count += 2;
- } elseif ($ currentByte == 252 || $currentByte == 253)
- {
- $n += 6;
- $count += 2;
- } else
- {
- $n++;
- $count++;
- }
- if ($count > = $length )
- {
- Break;
- }
- }
- return $count;
- } else
- {
- for ($i = 0; $i < $length; $i++)
- {
- if (ord($string) [$i ]) > 127)
- {
- $i++;
- $count++;
- }
- $count++;
- }
- return $count;
- }
- }
-
コードをコピー
|
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31