ホームページ > php教程 > php手册 > PHP 中国語と英語の混合タイプセットで文字列を処理するために一般的に使用される関数

PHP 中国語と英語の混合タイプセットで文字列を処理するために一般的に使用される関数

WBOY
リリース: 2016-06-13 12:32:17
オリジナル
930 人が閲覧しました

# 特定の位置が漢字の左半分か右半分であるか、中国語ではないかを判断します
# 戻り値 -1 左 0 漢字ではありません 1 右
# 使用法
/*
$ a = ' これは中国語です';
print is_chinese($a, 1); // 0
print is_chinese($a,8); // -1
print is_chinese($a,9) ; // 1
*/
function is_chinese(&$str, $location) {
$i = $location
while(ord($str[ $i] )>0xa0 && $i >= 0) {
$ch = !$ch;
$i --;

if($i != $location) {
$f_str = $ch ? 1: -1;
else {
$f_str = false;

🎜>}


# 中国語文字列反転関数
# strrev を使用して中国語文字を含む文字列を反転すると、文字化けコードが生成されます
/*
print cstrrev('this中国語です'); // 本文中 si ht
*/

function cstrrev(&$str) {
$long = strlen($str); =' ', $chinese=false, $i=$long-1; $i>=0; $i--) {
if(ord($str[$i]) > 0xa0) {
$ chinese = ! $chinese;
if($chinese == false) {
$f_str .= $str[$i].$str[$i 1]
}
else {
$f_str .= $str[$i];
}
}
return $f_str;
}
/* 中国語文字列インターセプト関数
一部の中国語の文字列インターセプト関数には、いくつかの問題が発生することがよくあります。たとえば、一部の自動行折り返しプログラムでは、
$a="1 in 2";
2 回インターセプトした後、
csubstr($str,$a,0 , 2);
csubstr($str, $a, 2,2)
読み込み位置が「middle」の右バイトを指しているので、結果は次のようになります
1, 2
この関数を使用すると、正しい結果が生成されます。
1, 2
*/
# 開始位置、0 から始まります
# long = 0、文字列の先頭から末尾までを取得します
# ltor = true の場合、文字は左から右に取得され、false の場合、文字は右から左に取得されます。
# $cn_len 中国語の文字は、単語番号で取得される場合はバイトまたは単語数で取得されます。 、漢字 1 文字は 1 バイトとしてカウントされます

function csubstr(&$str, $start=0, $long=0, $ltor=true, $cn_len=2) {
if($long == 0) $long = strlen($ str);
if($ltor == false) $str = cstrrev($str);

if($cn_len == 1) {

for($i=0 , $fs=0; $i$i = (ord($str[$fs]) for($i=0 , $fe=$fs; $i$i = (ord($str[$fe]) $long = $fe - $fs;

}
else {

$fs = (is_chinese($str, $start) == 1)開始 - 1 : $start;
$fe = $long $start - 1;
$end = (is_chinese($str, $fe) == -1) ? 🎜>$long = $end - $fs 1;
}

$f_str = substr($str, $fs, $long)
if($ltor == false) $f_str = cstrrev($f_str);

return $f_str;
}

# 左の文字列を取得します
# cn_len == 2 の場合、$long は文字数を受け取ります左、およびその逆
function cleft(&$str, $long, $cn_len=2) {
$f_str = csubstr($str, 0, $long, true, $cn_len); return $f_str;
}

# 正しい文字列を取得します
function cright(&$str, $long, $cn_len=2) {
$f_str = cstrrev($str);
$f_str = csubstr( $f_str, 0, $long, true, $cn_len);
$f_str = cstrrev($f_str);
return $f_str;漢字を複数行に分けて含む記事
# 改行による問題はもう発生しません! ! !
# 注: 記事の各行は n (chr(13)) で区切る必要があります。
# $width 1 行あたりの文字数
# $br 各行の終了文字として使用する文字line

function ctext_wrap(&$text, $width=60, $br="
") {
$lines =explode("n",$text); rows = count($ 行);

for($i=0; $i$len = strlen($lines[$i]); for($j= 0; $j$p = $j $width - 1;
$k = 0; len) {
while(!is_chinese($lines[$i], $p) && $lines[$i][$p] != ' ' && $p>$j) {
$k ;
$p --;
}
if($p == $j) $k = 0;
}
$f_str .= csubstr($lines[$i], $ j, $width- $k) . $br;
$j -= $k>}
}

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート