Rumah > pembangunan bahagian belakang > tutorial php > php函数substr、mb_substr、mb_strcut截取中文比较

php函数substr、mb_substr、mb_strcut截取中文比较

WBOY
Lepaskan: 2016-06-23 13:36:00
asal
1111 orang telah melayarinya

一、函数说明
    substr、mb_substr、mb_strcut这三个函数都用来截取字符串,所不同的是:substr是最简单的截取,无法适应中文;mb_substr是按字来切分字符串,而mb_strcut是按字节来切分字符串,截取中文都不会产生半个字符的现象。
    这三个函数的前三个参数完全一致,即:
第一个参数是操作对象
第二个参数是截取的起始位置
第三个参数是截取的数量
    mb_substr和mb_strcut还有第四个参数:第四个参数可以根据不同的字符集进行设置

  

//对待一个UTF8的中文字符是3个长度    

//对待一个gbk的中文字符是2个长度    

header("content-Type:text/html;charset=utf-8");    

    

//设置内部编码    

mb_internal_encoding('UTF-8');    

    

//测试     

$cn_str="钓鱼岛是中国的hehe";    

$en_str="this is just a test";    

    

    

//使用substr    

echo substr($cn_str,0,3).'
'; //钓    

echo substr($en_str,0,3).'

';   //thi    

    

    

//使用mbsubstr()    

echo "mb_substr-3:".mb_substr($cn_str,0,3).'
';   //钓鱼岛    按照字来划分     

echo "substr-3:".substr($cn_str,0,3).'
';//钓   按照字节来划分      

echo "mb_strcut-3:".mb_strcut($cn_str,0,3).'

'; //钓   按照字节来划分    

  

  

echo "mb_substr-4:".mb_substr($cn_str,0,4).'
';   //钓鱼岛    按照字来划分  

echo "substr-4:".substr($cn_str,0,4).'
'; //钓   按照字节来划分(出现乱码)      

echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'

'; //钓   按照字节来划分(不会出现乱码)    

  

  

  

  

echo strlen($cn_str).'
';   //26    

echo mb_strlen($cn_str).'
';  //12    

echo iconv_strlen($cn_str).'
';//26    

  

?>  


三、结论
        substr、mb_strcut表现都不够理想,mb_substr可以正常使用,但前提是要安装php扩展库,否则就要自己写一个适应各种情况的截取函数了。


sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan