PHP によって生成された中国語ピンイン イニシャルのツール クラスを共有する、_PHP チュートリアル

WBOY
リリース: 2016-07-13 10:11:49
オリジナル
848 人が閲覧しました

PHPで作られた中国語ピンイン頭文字ツールクラスを共有してください

コードは非常に簡単です。BB はあまりありません。コメントを理解できない人は、PHP を手放してください。 ! !

コードをコピーします コードは次のとおりです:

/**
* 中国語ピンイン頭文字ツール
* 注: 英語の文字列: 変更せずに返されます (数字を含む) 例: .abc123 => abc123
* 中国語の文字列: ピンインの最初の文字を返します。例: テスト文字列 => CSZFC
* 中国語と英語の混合文字列: ピンインと英語の最初の文字を返します。例: IiIj => WIWJ
* 例:
* $py = 新しい str2PY();
*
* $result = $py->getInitials('ジェイ・チョウ');
*
* //頭文字を取得します
* $result = $py->getFirstString('abc'); //A
* $resutl = $py->getFirstString("ジェイ・チョウ"); //Z
*
*/
クラスstr2py
{
    private $_pinyins = array(
=> 「あ」、
=> 「B」、
=> 「ち」、
=> 'D'、
=> 「え」、
=> 「ふ」、
=> 「ぐ」、
=> 「は」、
=> 「じ」、
=> 「き」
=> 「L」、
=> 「も」、
=> 「ん」、
=> 「お」、
=> 「ぴ」、
=> 「Q」、
=> 「り」、
=> 「す」
=> 「て」
=> 「わ」、
=> 「X」、
=> 「はい」
=> 「ず」、
    );
    プライベート $_charset = null;
    /**
* コンストラクター、必要なエンコーディングのデフォルトを指定します: utf-8
* utf-8、gb2312をサポート
*
* @param 不明なタイプ $charset
​​*/
    パブリック関数 __construct($charset = 'utf-8')
    {
        $this->_charset = $charset;
    }
    /**
* 中国語の文字列部分
*
* @param 文字列 $str
* @param int $start
* @param int $len
* @戻り文字列
​​*/
    プライベート関数 _msubstr($str, $start, $len)
    {
        $start = $start * 2;
        $len = $len * 2;
        $strlen = strlen($str);
        $結果 = '';
        for ($i = 0; $i < $strlen; $i++)
        {
            if ($i >= $start && $i < ($start + $len))
            {
                if (ord(substr($str, $i, 1)) > 129)
                {
                    $result .= substr($str, $i, 2);
                }
                それ以外
                {
                    $result .= substr($str, $i, 1);
                }
            }
            if (ord(substr($str, $i, 1)) > 129)
            {
                $i++;
            }
        }
        $result を返します;
    }
    /**
※文字列を配列(漢字または1文字単位)に分割します
*
* @param 文字列 $str
* @return 配列
​​*/
    プライベート関数 _cutWord($str)
    {
        $words = array();
        while ($str != "")
        {
            if ($this->_isAscii($str))
            {/* 非中文 */
                $words[] = $str[0];
                $str = substr($str, strlen($str[0]));
            }
            それ以外
            {
                $word = $this->_msubstr($str, 0, 1);
                $words[] = $word;
                $str = substr($str, strlen($word));
            }
        }
        $words を返します;
    }
    /**
* 文字が ASCII 文字であるかどうかを判断します
*
* @param 文字列 $char
* @return bool
​​*/
    プライベート関数 _isAscii($char)
    {
        return ( ord(substr($char, 0, 1)) < 160 );
    }
    /**
* 文字列の最初の 3 文字が ASCII 文字であるかどうかを判断します
*
* @param 文字列 $str
* @return bool
​​*/
    プライベート関数 _isAsciis($str)
    {
        $len = strlen($str) >= 3 ? 3:2;
        $chars = array();
        for ($i = 1; $i < $len - 1; $i++)
        {
            $chars[] = $this->_isAscii($str[$i]) ? 「はい」:「いいえ」;
        }
        $result = array_count_values($chars);
        if (empty($result['no']))
        {
            true を返します;
        }
        false を返します;
    }
    /**
* 中国語文字列の最初のピンイン文字を取得します
*
* @param 文字列 $str
* @戻り文字列
​​*/
    パブリック関数 getInitials($str)
    {
        if (空($str))
            戻ります '';
        if ($this->_isAscii($str[0]) && $this->_isAsciis($str))
        {
            $str;
を返します         }
        $result = array();
        if ($this->_charset == 'utf-8')
        {
            $str = iconv('utf-8', 'gb2312', $str);
        }
        $words = $this->_cutWord($str);
        foreach ($words を $word として)
        {
            if ($this->_isAscii($word))
            {/* 非中文 */
                $result[] = $word;
続行;
}
$code = ord(substr($word, 0, 1)) * 1000 + ord(substr($word, 1, 1));
/ * ピンインの最初の文字 A ~ Z を取得 * /
If (($i = $this->_search($code)) != -1)
{
$result[] = $this->_pinyins[$i];
}
}
return strtoupper(implode('', $result));
}
/**
* 20140624 wangtianbao 頭文字を取得
* * @param string $str
* * @戻り文字列
​​*/
パブリック関数 getFirstString($str)
{
//まず中国語を文字に変換します
$new_string = $this->getInitials($str);
if (empty($new_string))
{
戻ります '';
}
その他
{
return strtoupper(substr($new_string, 0, 1));
}
}
プライベート関数 _getChar($ascii)
{
If ($ascii >= 48 && $ascii <= 57)
{
return chr($ascii) /* 数値 */
}
elseif ($ascii >= 65 && $ascii <= 90)
{
return chr($ascii); }
elseif ($ascii >= 97 && $ascii {
return chr($ascii - 32) /* a--z */
; }
その他
{
return '-' /* その他 */
; }
}
/**
* 必要な漢字の内部コード (gb2312) に対応するピンイン文字 (二分法) を検索します
*
* @param int $code
* @return int
​​*/
プライベート関数_search($code)
{
$data = array_keys($this->_pinyins);
$ lower = 0;
$upper = sizeof($data) - 1;
$middle = (int)round(($ lower + $upper) / 2);
if ($code return -1;
for (;;)
{
if ($ lower > $upper)
{
$data[$ lower - 1]を返します;
}
$tmp = (int)round(($ lower + $upper) / 2);
if (!isset($data[$tmp]))
{
return $data[$middle];
}
その他
{
$middle = $tmp;
}
if ($data[$middle] < $code)
{
$ lower = (int) $middle + 1;
}
else if ($data[$middle] == $code)
{
return $data[$middle];
}
その他
{
$upper = (int) $middle - 1;
}
}
}
}

漢字の最初の文字を取得することは、現在ほとんどすべてのプロジェクトで必要とされる機能です。ここで推奨するコードは比較的効率的なコードであり、私のプロジェクトでも使用されています。何か問題が見つかった場合は、メッセージを残してください。 、一緒に進歩しましょう

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/926362.html技術記事 PHP で作成した中国語のピンイン頭文字ツールのクラスを紹介します。コードは非常に簡単です。コメントを理解できない人は、PHP を読んでください。 ! ! コードをコピー...
関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート