在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码,正则匹配中文汉字根据页面编码不同而略有区别:GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8编码:[x{4e00}-x{9fa5}]+/u 。
例
代码如下 | 复制代码 |
echo (mb_eregi("[x80-xff].","中d文") ? "有" : "无") ."汉字"; |
以下以PHP为例进行匹配:
代码如下 | 复制代码 |
$str = "学习php是一件快乐的事。"; 输出: Array ) |
正则汉字
代码如下 | 复制代码 |
$str = "请问php中的eregi如何匹配汉字"; |
preg_match_all("/(汉字)+/ism","我是汉字,看你把我怎么着!",$m_a);
了各个编码的高位与低位的开始与结束,那么自然就可以写出正则,而且直接是十六位的,有啥困难?呵呵。不过要注意,在php里面,表示十六位是用的x
我们还可以用该正则表达式来判断是否是gb2312的汉字
代码如下 | 复制代码 |
$str = "小小子"; |