在php中提供了大量字符串操作函数,像计算字符串长度或字符串截取函数,但是他们都只能简单的计算英文字符,不能对中文混合字符串进行操作,下面我来给大家介绍截取字符串长度与计算字符串长度的方法总结。
常用的字符处理函数
代码如下 | 复制代码 |
strstr(string,string) = strchr(,) //从前面第一次出现某个字符串的地方截取到最后 |
假设
$str="这是1个字符串";
这个串中包含了一个半角字符,同样执行:
代码如下 | 复制代码 |
if(strlen($str)>10) $str=substr($str,10); |
由于原字符串$str的第10、11个字符构成了汉字“符”;
执行串分割后会将该汉字一分为二,这样被截取的串就会发现乱码现象
那我们可以先来计算字符串长度
代码如下 | 复制代码 |
header('Content-type: text/html; charset=utf-8'); $pa = '/[x{4e00}-x{9fa5}]/siu'; ?> |
补充
PHP计算字符串长度,包括计算英文、GBK、UTF-8多种字符集下PHP如何计算字符串长度。英文字符串长度
strlen()是PHP自带的计算英文字符串的函数。
GBK字符串长度
中文字符计算为2个字符,英文字符计算为1个,可以统计中文字符串长度的函数。 function abslength($str){
代码如下 | 复制代码 |
$len=strlen($str); $i=0; while($i { if(preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/",$str[$i])) { $i+=2; } else { $i+=1; } } return $i; } |
UTF8字符串长度
下面定义的strlen_utf8函数可以统计UTF-8字符串的长度,但不同的是,该函数并不考虑字节,这有些类似
Javascript 中字符串的length方法,一个字符全部按 1 个长度计算。
略字节的方案)
代码如下 | 复制代码 |
function strlen_utf8($str) { $i = 0; $count = 0; $len = strlen ($str); while ($i $chr = ord ($str[$i]); $count++; $i++; if($i >= $len) break; if($chr & 0x80) { $chr while ($chr & 0x80) { $i++; $chr } } } return $count; } $str = "www.111cn.net-PHP资讯"; echo strlen_utf8($str); ?> |
这样就可以很准确的对你的中英文混合字体进行截取计算了,如例子
代码如下 | 复制代码 |
支持gb2312,gbk,utf-8,big5 中文截取方法 /* [x80-xbf]{3}/"; |