php は、指定された数の中国語文字列関数をインターセプトします。
まず、テスト用の文字列:
<p><?php</p>header("Content-Type:text/html;charset=utf-8");<br /><br />echo cn_substr_utf8('我是一个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('ai\'2145m a ch3我[是一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('【我,是一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('我是一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('我是,一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('我,是,一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('我是asd一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('【我i\'m[是一,个,和哈,哦也,,国家!',12);<br />echo '<br />',cn_substr_utf8('【i\'m a ch我[是一,个,和哈,哦也,,国家!',12);<br /><p>echo '<br />',cn_substr_utf8('【i\'2145m a ch3我[是一,个,和哈,哦也,,国家!',12);</p>
以下は、文字列を正確にインターセプトする関数コードです:
具体的な関数コードは次のとおりです:
//utf-8 中国語インターセプト、シングルバイトインターセプトモード
function cn_substr_utf8($str,$length,$append='...',$start=0){<br /> if(strlen($str)<$start+1){<br /> return '';<br /> }<br /> preg_match_all("/./su",$str,$ar);<br /> $str2='';<br /> $tstr='';<br /> //www.scutephp.com<br /> for($i=0;isset($ar[0][$i]);$i++){<br /> if(strlen($tstr)<$start){<br /> $tstr.=$ar[0][$i];<br /> }else{<br /> if(strlen($str2)<$length + strlen($ar[0][$i])){<br /> $str2.=$ar[0][$i];<br /> }else{<br /> break;<br /> }<br /> }<br /> }<br /> return $str==$str2?$str2:$str2.$append;<br />}