ヒント|質問|中国語|文字列
次のコードは、GB2312 エンコードに使用されます。PHP では、中国語の文字列をインターセプトするのが問題です。その解決策は、文字化けを避けるために、値が 128 以上であるかどうかに基づいてそれが 2 バイト文字であるかどうかを判断することです。ただし、中国語と英語の混合、特殊記号などの問題は常にあります。ここで、参考のためにより包括的なものを書きます:
プログラムの説明:
1 len パラメータは漢字に基づいており、1len は次のとおりです。形式上、英語の 2 文字に相当します。見た目が良くなります
2. マジックパラメータが false に設定されている場合、中国語と英語は同等に扱われ、絶対的な文字数が取得されます
3。 htmlspecialchars() でエンコードされた文字列
4. GB2312 でのエンティティ文字モード () の処理
プログラム コード:
<ccid_code>function FSubstr($title,$start,$len="",$magic=true) {/** * powered by Smartpig * mailto:d.einstein@263.net */ $length = 0;if($len == "") $len = strlen($title);//判断起始为不正确位置if($start > 0){ $cnum = 0; for($i=0;$i<$start;$i++) { if(ord(substr($title,$i,1)) >= 128) $cnum ++; } if($cnum%2 != 0) $start--; unset($cnum);}if(strlen($title)<=$len) return substr($title,$start,$len);$alen = 0;$blen = 0;$realnum = 0;for($i=$start;$i<STRLEN($TITLE);$I++) if(ord($cur) }else{ } $ctype="0;" ++; $blen { if($magic) $realnum +="4;" $i $length $cstep="0;" i?,substr($title,$i,8),$match)) &#(\d+); if(preg_match(? else $alen ?'?) if(substr($title,$i,6)="=" ?"?) ?&?) if(substr($title,$i,5)="=" ?>?) if(substr($title,$i,4)="=" ?<?) ?&?) if($cur="=" $cur="substr($title,$i,1);">=128) { $cstep = 2; $length += 2; $i += 1; $realnum ++; if($magic) { $blen ++; $ctype = 1; } }else{ $cstep = 1; $length +=1; $realnum ++; if($magic) { $alen++; } } } if($magic) { if(($blen*2+$alen) == ($len*2)) break; if(($blen*2+$alen) == ($len*2+1)) { if($ctype == 1) { $length -= $cstep; break; }else{ break; } } }else{ if($realnum == $len) break; }}unset($cur);unset($alen);unset($blen);unset($realnum);unset($ctype);unset($cstep);return substr($title,$start,$length);}</ccid_code>