実践的なヒント: PHP で中国語の文字列をインターセプトする際の問題

WBOY
リリース: 2016-06-21 09:10:06
オリジナル
881 人が閲覧しました

ヒント|質問|中国語|文字列

次のコードは、GB2312 エンコードに使用されます。PHP では、中国語の文字列をインターセプトするのが問題です。その解決策は、文字化けを避けるために、値が 128 以上であるかどうかに基づいてそれが 2 バイト文字であるかどうかを判断することです。ただし、中国語と英語の混合、特殊記号などの問題は常にあります。ここで、参考のためにより包括的なものを書きます:

プログラムの説明:

1 len パラメータは漢字に基づいており、1len は次のとおりです。形式上、英語の 2 文字に相当します。見た目が良くなります

2. マジックパラメータが false に設定されている場合、中国語と英語は同等に扱われ、絶対的な文字数が取得されます

3。 htmlspecialchars() でエンコードされた文字列

4. GB2312 でのエンティティ文字モード (𖰰) の処理

プログラム コード:

<ccid_code>function FSubstr($title,$start,$len="",$magic=true) {/**  *  powered by Smartpig  *  mailto:d.einstein@263.net  */  $length = 0;if($len == "") $len = strlen($title);//判断起始为不正确位置if($start > 0){  $cnum = 0;  for($i=0;$i<$start;$i++)  {   if(ord(substr($title,$i,1)) >= 128) $cnum ++;  }  if($cnum%2 != 0) $start--;    unset($cnum);}if(strlen($title)<=$len) return substr($title,$start,$len);$alen   = 0;$blen = 0;$realnum = 0;for($i=$start;$i<STRLEN($TITLE);$I++) if(ord($cur) }else{ } $ctype="0;" ++; $blen { if($magic) $realnum +="4;" $i $length $cstep="0;" i?,substr($title,$i,8),$match)) &#(\d+); if(preg_match(? else $alen ?&#039;?) if(substr($title,$i,6)="=" ?"?) ?&?) if(substr($title,$i,5)="=" ?>?) if(substr($title,$i,4)="=" ?<?) ?&?) if($cur="=" $cur="substr($title,$i,1);">=128)   {    $cstep = 2;    $length += 2;    $i += 1;    $realnum ++;    if($magic)    {     $blen ++;     $ctype = 1;    }   }else{    $cstep = 1;    $length +=1;    $realnum ++;    if($magic)    {     $alen++;    }   }  }    if($magic)  {   if(($blen*2+$alen) == ($len*2)) break;   if(($blen*2+$alen) == ($len*2+1))   {    if($ctype == 1)    {     $length -= $cstep;     break;    }else{     break;    }   }  }else{   if($realnum == $len) break;  }}unset($cur);unset($alen);unset($blen);unset($realnum);unset($ctype);unset($cstep);return substr($title,$start,$length);}</ccid_code>
ログイン後にコピー



関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート