首頁 後端開發 php教程 php程序如何把中文字符转换为拼音_PHP教程

php程序如何把中文字符转换为拼音_PHP教程

Jul 13, 2016 pm 05:46 PM
php 中文 為了 產品 關鍵字 名稱 如何 字元 拼音 搜素 資料庫 程式 轉換

 

为了做数据库的拼音关键字搜素想起了 把产品名称生成拼音做为关键字存入数据库,于是上网搜集资料整了个这么个东西

/**

 * 中文拼音转换类

 * @author julian.song

 * 部分代码来源与互联网,版权归原作者所有

 */

class Pinyin{

    public function __construct()

    {

 

    }

    /**

     * 把字符串转换为拼音

     * @param  $string ASCII码

     * @param  $charset 编码

     */

    public function getPinyin($string, $charset='gb2312')

    {

        $dataKey = "a|ai|an|ang|ao|ba|bai|ban|bang|bao|bei|ben|beng|bi|bian|biao|bie|bin|bing|bo|bu|ca|cai|can|cang|cao|ce|ceng|cha".

"|chai|chan|chang|chao|che|chen|cheng|chi|chong|chou|chu|chuai|chuan|chuang|chui|chun|chuo|ci|cong|cou|cu|".

"cuan|cui|cun|cuo|da|dai|dan|dang|dao|de|deng|di|dian|diao|die|ding|diu|dong|dou|du|duan|dui|dun|duo|e|en|er".

"|fa|fan|fang|fei|fen|feng|fo|fou|fu|ga|gai|gan|gang|gao|ge|gei|gen|geng|gong|gou|gu|gua|guai|guan|guang|gui".

"|gun|guo|ha|hai|han|hang|hao|he|hei|hen|heng|hong|hou|hu|hua|huai|huan|huang|hui|hun|huo|ji|jia|jian|jiang".

"|jiao|jie|jin|jing|jiong|jiu|ju|juan|jue|jun|ka|kai|kan|kang|kao|ke|ken|keng|kong|kou|ku|kua|kuai|kuan|kuang".

"|kui|kun|kuo|la|lai|lan|lang|lao|le|lei|leng|li|lia|lian|liang|liao|lie|lin|ling|liu|long|lou|lu|lv|luan|lue".

"|lun|luo|ma|mai|man|mang|mao|me|mei|men|meng|mi|mian|miao|mie|min|ming|miu|mo|mou|mu|na|nai|nan|nang|nao|ne".

"|nei|nen|neng|ni|nian|niang|niao|nie|nin|ning|niu|nong|nu|nv|nuan|nue|nuo|o|ou|pa|pai|pan|pang|pao|pei|pen".

"|peng|pi|pian|piao|pie|pin|ping|po|pu|qi|qia|qian|qiang|qiao|qie|qin|qing|qiong|qiu|qu|quan|que|qun|ran|rang".

"|rao|re|ren|reng|ri|rong|rou|ru|ruan|rui|run|ruo|sa|sai|san|sang|sao|se|sen|seng|sha|shai|shan|shang|shao|".

"she|shen|sheng|shi|shou|shu|shua|shuai|shuan|shuang|shui|shun|shuo|si|song|sou|su|suan|sui|sun|suo|ta|tai|".

"tan|tang|tao|te|teng|ti|tian|tiao|tie|ting|tong|tou|tu|tuan|tui|tun|tuo|wa|wai|wan|wang|wei|wen|weng|wo|wu".

"|xi|xia|xian|xiang|xiao|xie|xin|xing|xiong|xiu|xu|xuan|xue|xun|ya|yan|yang|yao|ye|yi|yin|ying|yo|yong|you".

"|yu|yuan|yue|yun|za|zai|zan|zang|zao|ze|zei|zen|zeng|zha|zhai|zhan|zhang|zhao|zhe|zhen|zheng|zhi|zhong|".

"zhou|zhu|zhua|zhuai|zhuan|zhuang|zhui|zhun|zhuo|zi|zong|zou|zu|zuan|zui|zun|zuo";

 

        $dataValue = "-20319|-20317|-20304|-20295|-20292|-20283|-20265|-20257|-20242|-20230|-20051|-20036|-20032|-20026|-20002|-19990".

"|-19986|-19982|-19976|-19805|-19784|-19775|-19774|-19763|-19756|-19751|-19746|-19741|-19739|-19728|-19725".

"|-19715|-19540|-19531|-19525|-19515|-19500|-19484|-19479|-19467|-19289|-19288|-19281|-19275|-19270|-19263".

"|-19261|-19249|-19243|-19242|-19238|-19235|-19227|-19224|-19218|-19212|-19038|-19023|-19018|-19006|-19003".

"|-18996|-18977|-18961|-18952|-18783|-18774|-18773|-18763|-18756|-18741|-18735|-18731|-18722|-18710|-18697".

"|-18696|-18526|-18518|-18501|-18490|-18478|-18463|-18448|-18447|-18446|-18239|-18237|-18231|-18220|-18211".

"|-18201|-18184|-18183|-18181|-18012|-17997|-17988|-17970|-17964|-17961|-17950|-17947|-17931|-17928|-17922".

"|-17759|-17752|-17733|-17730|-17721|-17703|-17701|-17697|-17692|-17683|-17676|-17496|-17487|-17482|-17468".

"|-17454|-17433|-17427|-17417|-17202|-17185|-16983|-16970|-16942|-16915|-16733|-16708|-16706|-16689|-16664".

"|-16657|-16647|-16474|-16470|-16465|-16459|-16452|-16448|-16433|-16429|-16427|-16423|-16419|-16412|-16407".

"|-16403|-16401|-16393|-16220|-16216|-16212|-16205|-16202|-16187|-16180|-16171|-16169|-16158|-16155|-15959".

"|-15958|-15944|-15933|-15920|-15915|-15903|-15889|-15878|-15707|-15701|-15681|-15667|-15661|-15659|-15652".

"|-15640|-15631|-15625|-15454|-15448|-15436|-15435|-15419|-15416|-15408|-15394|-15385|-15377|-15375|-15369".

"|-15363|-15362|-15183|-15180|-15165|-15158|-15153|-15150|-15149|-15144|-15143|-15141|-15140|-15139|-15128".

"|-15121|-15119|-15117|-15110|-15109|-14941|-14937|-14933|-14930|-14929|-14928|-14926|-14922|-14921|-14914".

"|-14908|-14902|-14894|-14889|-14882|-14873|-14871|-14857|-14678|-14674|-14670|-14668|-14663|-14654|-14645".

"|-14630|-14594|-14429|-14407|-14399|-14384|-14379|-14368|-14355|-14353|-14345|-14170|-14159|-14151|-14149".

"|-14145|-14140|-14137|-14135|-14125|-14123|-14122|-14112|-14109|-14099|-14097|-14094|-14092|-14090|-14087".

"|-14083|-13917|-13914|-13910|-13907|-13906|-13905|-13896|-13894|-13878|-13870|-13859|-13847|-13831|-13658".

"|-13611|-13601|-13406|-13404|-13400|-13398|-13395|-13391|-13387|-13383|-13367|-13359|-13356|-13343|-13340".

"|-13329|-13326|-13318|-13147|-13138|-13120|-13107|-13096|-13095|-13091|-13076|-13068|-13063|-13060|-12888".

"|-12875|-12871|-12860|-12858|-12852|-12849|-12838|-12831|-12829|-12812|-12802|-12607|-12597|-12594|-12585".

"|-12556|-12359|-12346|-12320|-12300|-12120|-12099|-12089|-12074|-12067|-12058|-12039|-11867|-11861|-11847".

"|-11831|-11798|-11781|-11604|-11589|-11536|-11358|-11340|-11339|-11324|-11303|-11097|-11077|-11067|-11055".

"|-11052|-11045|-11041|-11038|-11024|-11020|-11019|-11018|-11014|-10838|-10832|-10815|-10800|-10790|-10780".

"|-10764|-10587|-10544|-10533|-10519|-10331|-10329|-10328|-10322|-10315|-10309|-10307|-10296|-10281|-10274".

"|-10270|-10262|-10260|-10256|-10254";

        $tDataKey = explode('|', $dataKey);

        $tDataValue = explode('|', $dataValue);

 

        $data = (PHP_VERSION>='5.0') ? array_combine($tDataKey, $tDataValue) : $this->arrayCombine($tDataKey, $tDataValue);

        arsort($data);

        reset($data);

        if($charset != 'gb2312') $string = $this->utf82GB2312($string);

        $res = '';

        for($i=0; $i

        {

            $asc = ord(substr($string, $i, 1));

            if($asc>160) { $q = ord(substr($string, ++$i, 1)); $asc = $asc*256 + $q - 65536; }

            $res .= $this->asc2Pinyin($asc, $data);

        }

        return preg_replace("/[^a-z0-9]*/", '', $res);

    }

    /**

     * 把ASCII码转换为对应的拼音

     * @param  $asc ASCII码

     * @param  $data ASCII码拼音字符对照表

     */

    public function asc2Pinyin($asc, $data)

    {

        if ($asc>0 && $asc

        elseif($asc-10247) return '';

        else {

            foreach($data as $k=>$v){ if($v

            return $k;

        }

    }

    /**

     * 将UFT8字符的编码转化为GB2312

     * @param $char

     */

    public function utf82GB2312($char)

    {

        $string = '';

        if($char

        elseif($char

        {

            $string .= chr(0xC0 | $char>>6);

            $string .= chr(0x80 | $char & 0x3F);

        }elseif($char

            $string .= chr(0xE0 | $char>>12);

            $string .= chr(0x80 | $char>>6 & 0x3F);

            $string .= chr(0x80 | $char & 0x3F);

        } elseif($char

            $string .= chr(0xF0 | $char>>18);

            $string .= chr(0x80 | $char>>12 & 0x3F);

            $string .= chr(0x80 | $char>>6 & 0x3F);

            $string .= chr(0x80 | $char & 0x3F);

        }

        return iconv('UTF-8', 'GB2312//IGNORE', $string);

    }

    /**

     * 比较数组

     * @param $arr1 数组1

     * @param $arr2 数组2

     */

    public function arrayCombine($arr1, $arr2)

    {

        for($i=0; $i

        return $res;

    }

    /**

     *获得汉字的拼音首字母

     * @param $str 字符串

     */

    public function getInitial($str,$charset) {

        if($charset=="UTF-8")$str=$this->utf82GB2312($str);

        $asc = ord(substr($str, 0, 1));

        if ($asc

            if ($asc >= 48 && $asc

                return chr($asc);  //数字

            } elseif ($asc >= 65 && $asc

                return chr($asc);   // A--Z

            } elseif ($asc >= 97 && $asc

                return chr($asc - 32); // a--z

            } else {

                return '-'; //其他

            }

        } else {//中文

            $asc = $asc * 1000 + ord(substr($str, 1, 1));

            //获取拼音首字母A--Z

            if ($asc >= 176161 && $asc

                return 'A';

            } elseif ($asc >= 176197 && $asc

                return 'B';

            } elseif ($asc >= 178193 && $asc

                return 'C';

            } elseif ($asc >= 180238 && $asc

                return 'D';

            } elseif ($asc >= 182234 && $asc

                return 'E';

            } elseif ($asc >= 183162 && $asc

                return 'F';

            } elseif ($asc >= 184193 && $asc

                return 'G';

            } elseif ($asc >= 185254 && $asc

                return 'H';

            } elseif ($asc >= 187247 && $asc

                return 'J';

            } elseif ($asc >= 191166 && $asc

                return 'K';

            } elseif ($asc >= 192172 && $asc

                return 'L';

            } elseif ($asc >= 194232 && $asc

                return 'M';

            } elseif ($asc >= 196195 && $asc

                return 'N';

            } elseif ($asc >= 197182 && $asc

                return 'O';

            } elseif ($asc >= 197190 && $asc

                return 'P';

            } elseif ($asc >= 198218 && $asc

                return 'Q';

            } elseif ($asc >= 200187 && $asc

                return 'R';

            } elseif ($asc >= 200246 && $asc

                return 'S';

            } elseif ($asc >= 203250 && $asc

                return 'T';

            } elseif ($asc >= 205218 && $asc

                return 'W';

            } elseif ($asc >= 206244 && $asc

                return 'X';

            } elseif ($asc >= 209185 && $asc

                return 'Y';

            } elseif ($asc >= 212209) {

                return 'Z';

            } else {

                return '-';

            }

        }

    }

    /**

     * 拆分字符串为数组

     * @param $str 字符串

     * @param $charset 编码

     */

    public function mbStringtoArray($str,$charset) {

        $strlen=mb_strlen($str);

        while($strlen){

            $array[]=mb_substr($str,0,1,$charset);

            $str=mb_substr($str,1,$strlen,$charset);

            $strlen=mb_strlen($str);

        }

        return $array;

    }

    public function getInitials($str,$charset){

        $initials="";

        foreach($this->mbStringtoArray($str,$charset)as $char){

            $initials.=$this->getInitial($char,$charset);

        }

        return $initials;

    }

}

 

本文出自 “大白良” 博客

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/478599.htmlTechArticle为了做数据库的拼音关键字搜素想起了 把产品名称生成拼音做为关键字存入数据库,于是上网搜集资料整了个这么个东西 ?php /** * 中文拼音...

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1670
14
CakePHP 教程
1428
52
Laravel 教程
1329
25
PHP教程
1276
29
C# 教程
1256
24
PHP和Python:解釋了不同的範例 PHP和Python:解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

在PHP和Python之間進行選擇:指南 在PHP和Python之間進行選擇:指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP和Python:深入了解他們的歷史 PHP和Python:深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

PHP的影響:網絡開發及以後 PHP的影響:網絡開發及以後 Apr 18, 2025 am 12:10 AM

PHPhassignificantlyimpactedwebdevelopmentandextendsbeyondit.1)ItpowersmajorplatformslikeWordPressandexcelsindatabaseinteractions.2)PHP'sadaptabilityallowsittoscaleforlargeapplicationsusingframeworkslikeLaravel.3)Beyondweb,PHPisusedincommand-linescrip

PHP與Python:用例和應用程序 PHP與Python:用例和應用程序 Apr 17, 2025 am 12:23 AM

PHP適用於Web開發和內容管理系統,Python適合數據科學、機器學習和自動化腳本。 1.PHP在構建快速、可擴展的網站和應用程序方面表現出色,常用於WordPress等CMS。 2.Python在數據科學和機器學習領域表現卓越,擁有豐富的庫如NumPy和TensorFlow。

繼續使用PHP:耐力的原因 繼續使用PHP:耐力的原因 Apr 19, 2025 am 12:23 AM

PHP仍然流行的原因是其易用性、靈活性和強大的生態系統。 1)易用性和簡單語法使其成為初學者的首選。 2)與web開發緊密結合,處理HTTP請求和數據庫交互出色。 3)龐大的生態系統提供了豐富的工具和庫。 4)活躍的社區和開源性質使其適應新需求和技術趨勢。

MySQL:結構化數據和關係數據庫 MySQL:結構化數據和關係數據庫 Apr 18, 2025 am 12:22 AM

MySQL通過表結構和SQL查詢高效管理結構化數據,並通過外鍵實現表間關係。 1.創建表時定義數據格式和類型。 2.使用外鍵建立表間關係。 3.通過索引和查詢優化提高性能。 4.定期備份和監控數據庫確保數據安全和性能優化。

甲骨文在商業世界中的作用 甲骨文在商業世界中的作用 Apr 23, 2025 am 12:01 AM

Oracle不僅是數據庫公司,還是雲計算和ERP系統的領導者。 1.Oracle提供從數據庫到雲服務和ERP系統的全面解決方案。 2.OracleCloud挑戰AWS和Azure,提供IaaS、PaaS和SaaS服務。 3.Oracle的ERP系統如E-BusinessSuite和FusionApplications幫助企業優化運營。

See all articles