Rumah > php教程 > php手册 > PHP截取中文字符串,无乱码,基于正则

PHP截取中文字符串,无乱码,基于正则

WBOY
Lepaskan: 2016-06-06 19:35:44
asal
1582 orang telah melayarinya

多数网上的PHP中文字符串截取,计算长度用的是逐个字符遍历的方法,看起来比较复杂 这里提供哦你一种基于正则的解决方案,GBK,UTF-8的中文字符串测试通过 无 ?php/** * @brief strlen_mb 计算字符串长度,支持中文,自动检测编码,UTF-8与GBK测试通过 * * @p

多数网上的PHP中文字符串截取,计算长度用的是逐个字符遍历的方法,看起来比较复杂
这里提供哦你一种基于正则的解决方案,GBK,UTF-8的中文字符串测试通过
<?php

/**
 * @brief strlen_mb 计算字符串长度,支持中文,自动检测编码,UTF-8与GBK测试通过
 *
 * @param $str
 *
 * @return 
 */
function strlen_mb($str){
    $mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
    $patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '})/';
    $match = preg_match_all($patt, $str, $groups);
    if($groups){
        return count($groups[0]);
    }else{
        return false;
    }
}

/**
 * @brief substr_mb 截取字符串,中文防乱码,自动检测编码,UTF-8与GBK测试通过
 *
 * @param $str
 * @param $start
 * @param $len
 *
 * @return 
 */
function substr_mb($str, $start, $len){
    $mb_len = mb_detect_encoding($str) == 'UTF-8' ? 2 : 1;
    $patt = '/([\x00-\x7f]|[\x80-\xff].{' . $mb_len . '}){' . $len . '}/';
    preg_match($patt, $str, $groups);
    if($groups){
        return $groups[0];
    }else{
        return false;
    }
}

echo '<meta charset=utf-8>';
$str = '北京dd欢迎你';
for($i = 0; $i <= strlen_mb($str); $i++){
    var_dump(substr_mb($str, 0, $i));
}
Salin selepas log masuk
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Cadangan popular
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan