백엔드 개발 PHP 튜토리얼 php程序如何把中文字符转换为拼音_PHP教程

php程序如何把中文字符转换为拼音_PHP教程

Jul 13, 2016 pm 05:46 PM
php 중국인 ~을 위한 ~을 위한 제품 하다 키워드 이름 어떻게 성격 묶음 병음 검색 요소 데이터 베이스 ~의 프로그램 전환하다

 

为了做数据库的拼音关键字搜素想起了 把产品名称生成拼音做为关键字存入数据库,于是上网搜集资料整了个这么个东西

/**

 * 中文拼音转换类

 * @author julian.song

 * 部分代码来源与互联网,版权归原作者所有

 */

class Pinyin{

    public function __construct()

    {

 

    }

    /**

     * 把字符串转换为拼音

     * @param  $string ASCII码

     * @param  $charset 编码

     */

    public function getPinyin($string, $charset='gb2312')

    {

        $dataKey = "a|ai|an|ang|ao|ba|bai|ban|bang|bao|bei|ben|beng|bi|bian|biao|bie|bin|bing|bo|bu|ca|cai|can|cang|cao|ce|ceng|cha".

"|chai|chan|chang|chao|che|chen|cheng|chi|chong|chou|chu|chuai|chuan|chuang|chui|chun|chuo|ci|cong|cou|cu|".

"cuan|cui|cun|cuo|da|dai|dan|dang|dao|de|deng|di|dian|diao|die|ding|diu|dong|dou|du|duan|dui|dun|duo|e|en|er".

"|fa|fan|fang|fei|fen|feng|fo|fou|fu|ga|gai|gan|gang|gao|ge|gei|gen|geng|gong|gou|gu|gua|guai|guan|guang|gui".

"|gun|guo|ha|hai|han|hang|hao|he|hei|hen|heng|hong|hou|hu|hua|huai|huan|huang|hui|hun|huo|ji|jia|jian|jiang".

"|jiao|jie|jin|jing|jiong|jiu|ju|juan|jue|jun|ka|kai|kan|kang|kao|ke|ken|keng|kong|kou|ku|kua|kuai|kuan|kuang".

"|kui|kun|kuo|la|lai|lan|lang|lao|le|lei|leng|li|lia|lian|liang|liao|lie|lin|ling|liu|long|lou|lu|lv|luan|lue".

"|lun|luo|ma|mai|man|mang|mao|me|mei|men|meng|mi|mian|miao|mie|min|ming|miu|mo|mou|mu|na|nai|nan|nang|nao|ne".

"|nei|nen|neng|ni|nian|niang|niao|nie|nin|ning|niu|nong|nu|nv|nuan|nue|nuo|o|ou|pa|pai|pan|pang|pao|pei|pen".

"|peng|pi|pian|piao|pie|pin|ping|po|pu|qi|qia|qian|qiang|qiao|qie|qin|qing|qiong|qiu|qu|quan|que|qun|ran|rang".

"|rao|re|ren|reng|ri|rong|rou|ru|ruan|rui|run|ruo|sa|sai|san|sang|sao|se|sen|seng|sha|shai|shan|shang|shao|".

"she|shen|sheng|shi|shou|shu|shua|shuai|shuan|shuang|shui|shun|shuo|si|song|sou|su|suan|sui|sun|suo|ta|tai|".

"tan|tang|tao|te|teng|ti|tian|tiao|tie|ting|tong|tou|tu|tuan|tui|tun|tuo|wa|wai|wan|wang|wei|wen|weng|wo|wu".

"|xi|xia|xian|xiang|xiao|xie|xin|xing|xiong|xiu|xu|xuan|xue|xun|ya|yan|yang|yao|ye|yi|yin|ying|yo|yong|you".

"|yu|yuan|yue|yun|za|zai|zan|zang|zao|ze|zei|zen|zeng|zha|zhai|zhan|zhang|zhao|zhe|zhen|zheng|zhi|zhong|".

"zhou|zhu|zhua|zhuai|zhuan|zhuang|zhui|zhun|zhuo|zi|zong|zou|zu|zuan|zui|zun|zuo";

 

        $dataValue = "-20319|-20317|-20304|-20295|-20292|-20283|-20265|-20257|-20242|-20230|-20051|-20036|-20032|-20026|-20002|-19990".

"|-19986|-19982|-19976|-19805|-19784|-19775|-19774|-19763|-19756|-19751|-19746|-19741|-19739|-19728|-19725".

"|-19715|-19540|-19531|-19525|-19515|-19500|-19484|-19479|-19467|-19289|-19288|-19281|-19275|-19270|-19263".

"|-19261|-19249|-19243|-19242|-19238|-19235|-19227|-19224|-19218|-19212|-19038|-19023|-19018|-19006|-19003".

"|-18996|-18977|-18961|-18952|-18783|-18774|-18773|-18763|-18756|-18741|-18735|-18731|-18722|-18710|-18697".

"|-18696|-18526|-18518|-18501|-18490|-18478|-18463|-18448|-18447|-18446|-18239|-18237|-18231|-18220|-18211".

"|-18201|-18184|-18183|-18181|-18012|-17997|-17988|-17970|-17964|-17961|-17950|-17947|-17931|-17928|-17922".

"|-17759|-17752|-17733|-17730|-17721|-17703|-17701|-17697|-17692|-17683|-17676|-17496|-17487|-17482|-17468".

"|-17454|-17433|-17427|-17417|-17202|-17185|-16983|-16970|-16942|-16915|-16733|-16708|-16706|-16689|-16664".

"|-16657|-16647|-16474|-16470|-16465|-16459|-16452|-16448|-16433|-16429|-16427|-16423|-16419|-16412|-16407".

"|-16403|-16401|-16393|-16220|-16216|-16212|-16205|-16202|-16187|-16180|-16171|-16169|-16158|-16155|-15959".

"|-15958|-15944|-15933|-15920|-15915|-15903|-15889|-15878|-15707|-15701|-15681|-15667|-15661|-15659|-15652".

"|-15640|-15631|-15625|-15454|-15448|-15436|-15435|-15419|-15416|-15408|-15394|-15385|-15377|-15375|-15369".

"|-15363|-15362|-15183|-15180|-15165|-15158|-15153|-15150|-15149|-15144|-15143|-15141|-15140|-15139|-15128".

"|-15121|-15119|-15117|-15110|-15109|-14941|-14937|-14933|-14930|-14929|-14928|-14926|-14922|-14921|-14914".

"|-14908|-14902|-14894|-14889|-14882|-14873|-14871|-14857|-14678|-14674|-14670|-14668|-14663|-14654|-14645".

"|-14630|-14594|-14429|-14407|-14399|-14384|-14379|-14368|-14355|-14353|-14345|-14170|-14159|-14151|-14149".

"|-14145|-14140|-14137|-14135|-14125|-14123|-14122|-14112|-14109|-14099|-14097|-14094|-14092|-14090|-14087".

"|-14083|-13917|-13914|-13910|-13907|-13906|-13905|-13896|-13894|-13878|-13870|-13859|-13847|-13831|-13658".

"|-13611|-13601|-13406|-13404|-13400|-13398|-13395|-13391|-13387|-13383|-13367|-13359|-13356|-13343|-13340".

"|-13329|-13326|-13318|-13147|-13138|-13120|-13107|-13096|-13095|-13091|-13076|-13068|-13063|-13060|-12888".

"|-12875|-12871|-12860|-12858|-12852|-12849|-12838|-12831|-12829|-12812|-12802|-12607|-12597|-12594|-12585".

"|-12556|-12359|-12346|-12320|-12300|-12120|-12099|-12089|-12074|-12067|-12058|-12039|-11867|-11861|-11847".

"|-11831|-11798|-11781|-11604|-11589|-11536|-11358|-11340|-11339|-11324|-11303|-11097|-11077|-11067|-11055".

"|-11052|-11045|-11041|-11038|-11024|-11020|-11019|-11018|-11014|-10838|-10832|-10815|-10800|-10790|-10780".

"|-10764|-10587|-10544|-10533|-10519|-10331|-10329|-10328|-10322|-10315|-10309|-10307|-10296|-10281|-10274".

"|-10270|-10262|-10260|-10256|-10254";

        $tDataKey = explode('|', $dataKey);

        $tDataValue = explode('|', $dataValue);

 

        $data = (PHP_VERSION>='5.0') ? array_combine($tDataKey, $tDataValue) : $this->arrayCombine($tDataKey, $tDataValue);

        arsort($data);

        reset($data);

        if($charset != 'gb2312') $string = $this->utf82GB2312($string);

        $res = '';

        for($i=0; $i

        {

            $asc = ord(substr($string, $i, 1));

            if($asc>160) { $q = ord(substr($string, ++$i, 1)); $asc = $asc*256 + $q - 65536; }

            $res .= $this->asc2Pinyin($asc, $data);

        }

        return preg_replace("/[^a-z0-9]*/", '', $res);

    }

    /**

     * 把ASCII码转换为对应的拼音

     * @param  $asc ASCII码

     * @param  $data ASCII码拼音字符对照表

     */

    public function asc2Pinyin($asc, $data)

    {

        if ($asc>0 && $asc

        elseif($asc-10247) return '';

        else {

            foreach($data as $k=>$v){ if($v

            return $k;

        }

    }

    /**

     * 将UFT8字符的编码转化为GB2312

     * @param $char

     */

    public function utf82GB2312($char)

    {

        $string = '';

        if($char

        elseif($char

        {

            $string .= chr(0xC0 | $char>>6);

            $string .= chr(0x80 | $char & 0x3F);

        }elseif($char

            $string .= chr(0xE0 | $char>>12);

            $string .= chr(0x80 | $char>>6 & 0x3F);

            $string .= chr(0x80 | $char & 0x3F);

        } elseif($char

            $string .= chr(0xF0 | $char>>18);

            $string .= chr(0x80 | $char>>12 & 0x3F);

            $string .= chr(0x80 | $char>>6 & 0x3F);

            $string .= chr(0x80 | $char & 0x3F);

        }

        return iconv('UTF-8', 'GB2312//IGNORE', $string);

    }

    /**

     * 比较数组

     * @param $arr1 数组1

     * @param $arr2 数组2

     */

    public function arrayCombine($arr1, $arr2)

    {

        for($i=0; $i

        return $res;

    }

    /**

     *获得汉字的拼音首字母

     * @param $str 字符串

     */

    public function getInitial($str,$charset) {

        if($charset=="UTF-8")$str=$this->utf82GB2312($str);

        $asc = ord(substr($str, 0, 1));

        if ($asc

            if ($asc >= 48 && $asc

                return chr($asc);  //数字

            } elseif ($asc >= 65 && $asc

                return chr($asc);   // A--Z

            } elseif ($asc >= 97 && $asc

                return chr($asc - 32); // a--z

            } else {

                return '-'; //其他

            }

        } else {//中文

            $asc = $asc * 1000 + ord(substr($str, 1, 1));

            //获取拼音首字母A--Z

            if ($asc >= 176161 && $asc

                return 'A';

            } elseif ($asc >= 176197 && $asc

                return 'B';

            } elseif ($asc >= 178193 && $asc

                return 'C';

            } elseif ($asc >= 180238 && $asc

                return 'D';

            } elseif ($asc >= 182234 && $asc

                return 'E';

            } elseif ($asc >= 183162 && $asc

                return 'F';

            } elseif ($asc >= 184193 && $asc

                return 'G';

            } elseif ($asc >= 185254 && $asc

                return 'H';

            } elseif ($asc >= 187247 && $asc

                return 'J';

            } elseif ($asc >= 191166 && $asc

                return 'K';

            } elseif ($asc >= 192172 && $asc

                return 'L';

            } elseif ($asc >= 194232 && $asc

                return 'M';

            } elseif ($asc >= 196195 && $asc

                return 'N';

            } elseif ($asc >= 197182 && $asc

                return 'O';

            } elseif ($asc >= 197190 && $asc

                return 'P';

            } elseif ($asc >= 198218 && $asc

                return 'Q';

            } elseif ($asc >= 200187 && $asc

                return 'R';

            } elseif ($asc >= 200246 && $asc

                return 'S';

            } elseif ($asc >= 203250 && $asc

                return 'T';

            } elseif ($asc >= 205218 && $asc

                return 'W';

            } elseif ($asc >= 206244 && $asc

                return 'X';

            } elseif ($asc >= 209185 && $asc

                return 'Y';

            } elseif ($asc >= 212209) {

                return 'Z';

            } else {

                return '-';

            }

        }

    }

    /**

     * 拆分字符串为数组

     * @param $str 字符串

     * @param $charset 编码

     */

    public function mbStringtoArray($str,$charset) {

        $strlen=mb_strlen($str);

        while($strlen){

            $array[]=mb_substr($str,0,1,$charset);

            $str=mb_substr($str,1,$strlen,$charset);

            $strlen=mb_strlen($str);

        }

        return $array;

    }

    public function getInitials($str,$charset){

        $initials="";

        foreach($this->mbStringtoArray($str,$charset)as $char){

            $initials.=$this->getInitial($char,$charset);

        }

        return $initials;

    }

}

 

本文出自 “大白良” 博客

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/478599.htmlTechArticle为了做数据库的拼音关键字搜素想起了 把产品名称生成拼音做为关键字存入数据库,于是上网搜集资料整了个这么个东西 ?php /** * 中文拼音...

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

뜨거운 기사 태그

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드 Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드 Dec 24, 2024 pm 04:42 PM

Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드

CakePHP 날짜 및 시간 CakePHP 날짜 및 시간 Sep 10, 2024 pm 05:27 PM

CakePHP 날짜 및 시간

CakePHP 프로젝트 구성 CakePHP 프로젝트 구성 Sep 10, 2024 pm 05:25 PM

CakePHP 프로젝트 구성

CakePHP 파일 업로드 CakePHP 파일 업로드 Sep 10, 2024 pm 05:27 PM

CakePHP 파일 업로드

CakePHP 라우팅 CakePHP 라우팅 Sep 10, 2024 pm 05:25 PM

CakePHP 라우팅

CakePHP 토론 CakePHP 토론 Sep 10, 2024 pm 05:28 PM

CakePHP 토론

CakePHP 빠른 가이드 CakePHP 빠른 가이드 Sep 10, 2024 pm 05:27 PM

CakePHP 빠른 가이드

PHP 개발을 위해 Visual Studio Code(VS Code)를 설정하는 방법 PHP 개발을 위해 Visual Studio Code(VS Code)를 설정하는 방법 Dec 20, 2024 am 11:31 AM

PHP 개발을 위해 Visual Studio Code(VS Code)를 설정하는 방법

See all articles