백엔드 개발 PHP 튜토리얼 php判断是不是为中文正则表达式大全(转)

php判断是不是为中文正则表达式大全(转)

Jun 13, 2016 pm 01:06 PM
count echo match str

php判断是否为中文正则表达式大全(转)

转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html

?

?

php判断是否为中文正则表达式大全

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???

?

编码范围1. GBK (GB2312/GB18030)???
\x00-\xff GBK双字节编码范围???
\x20-\x7f ASCII???
\xa1-\xff 中文???
\x80-\xff 中文??
??
2. UTF-8 (Unicode)???
\u4e00-\u9fa5 (中文)???
\x3130-\x318F (韩文???
\xAC00-\xD7A3 (韩文)???
\u0800-\u4e00 (日文)???
ps: 韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???

?

?

  1. //判断内容里有没有中文-GBK?(PHP)????? ??
  2. function ?check_is_chinese( $s ){????? ??
  3. ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
  4. }????? ??
  5. ??? ??
  6. //获取字符串长度-GBK?(PHP)????? ??
  7. function ?gb_strlen( $str ){????? ??
  8. ????? $count ?=?0;????? ??
  9. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  10. ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
  11. ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
  12. ???????????++ $count ;????? ??
  13. ?????}????? ??
  14. ????? return ? $count ;????? ??
  15. }????? ??
  16. ??? ??
  17. //截取字符串字串-GBK?(PHP)????? ??
  18. function ?gb_substr( $str ,? $len ){????? ??
  19. ????? $count ?=?0;????? ??
  20. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  21. ????????? if ( $count ?==? $len )? break ;????? ??
  22. ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
  23. ???????????++ $count ;????????????? ??
  24. ?????}????? ??
  25. ????? return ? substr ( $str ,?0,? $i );????? ??
  26. }????? ??
  27. ??? ??
  28. //统计字符串长度-UTF8?(PHP)????? ??
  29. function ?utf8_strlen( $str )?{????? ??
  30. ????? $count ?=?0;????? ??
  31. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  32. ????????? $value ?=?ord( $str [ $i ]);????? ??
  33. ????????? if ( $value ?>?127)?{????? ??
  34. ????????????? $count ++;????? ??
  35. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  36. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  37. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  38. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  39. ?????????}????? ??
  40. ????????? $count ++;????? ??
  41. ?????}????? ??
  42. ????? return ? $count ;????? ??
  43. }????? ??
  44. ??? ??
  45. ??? ??
  46. //截取字符串-UTF8(PHP)????? ??
  47. function ?utf8_substr( $str , $position , $length ){????? ??
  48. ????? $start_position ?=? strlen ( $str );????? ??
  49. ????? $start_byte ?=?0;????? ??
  50. ????? $end_position ?=? strlen ( $str );????? ??
  51. ????? $count ?=?0;????? ??
  52. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  53. ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
  54. ????????????? $start_position ?=? $i ;????? ??
  55. ????????????? $start_byte ?=? $count ;????? ??
  56. ?????????}????? ??
  57. ????????? if (( $count - $start_byte )>= $length )?{????? ??
  58. ????????????? $end_position ?=? $i ;????? ??
  59. ????????????? break ;????? ??
  60. ?????????}????????? ??
  61. ????????? $value ?=?ord( $str [ $i ]);????? ??
  62. ????????? if ( $value ?>?127){????? ??
  63. ????????????? $count ++;????? ??
  64. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  65. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  66. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  67. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  68. ?????????}????? ??
  69. ????????? $count ++;????? ??
  70. ??? ??
  71. ?????}????? ??
  72. ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
  73. }????? ??
  74. ??? ??
  75. //判断是否是有韩文-UTF-8?(JavaScript)????? ??
  76. function ?checkKoreaChar(str)?{????? ??
  77. ????? for (i=0;?i
  78. ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
  79. ????????????? return ?true;????? ??
  80. ?????????}????? ??
  81. ?????}????? ??
  82. ????? return ?false;????? ??
  83. }????? ??
  84. ??? ??
  85. //判断是否有中文字符-GBK?(JavaScript)????? ??
  86. function ?check_chinese_char(s){????? ??
  87. ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
  88. }???

?

UTF-8匹配:

在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}

php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。

重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释

php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,

同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错


网上只能找到匹配全角字符的正则:?? ^[\x80-\xff]*^/??? ,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

$action = trim($_GET['action']);
if($action == "sub")
{
??? $str = $_POST['dir'];???
??? //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式
??? if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))?? //UTF-8汉字字母数字下划线正则表达式
??? {??
??????? echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
??????? echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>


输入字符(数字,字母,汉字,下划线):
???
???


GBK:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

?

?

?

?

?

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

카운트와 카운트의 차이점 카운트와 카운트의 차이점 Nov 20, 2023 am 10:01 AM

Count 함수는 지정된 범위 내의 숫자 수를 계산하는 데 사용됩니다. 텍스트, 논리값 및 Null 값은 무시하지만 빈 셀의 개수는 계산됩니다. Count 함수는 실제 숫자가 포함된 셀의 개수만 계산합니다. CountA 함수는 지정된 범위에서 비어 있지 않은 셀의 수를 계산하는 데 사용됩니다. 실제 숫자가 포함된 셀의 개수뿐만 아니라 텍스트, 논리값 및 수식이 포함된 비어 있지 않은 셀의 개수도 계산됩니다.

기술 세계를 탐험할 수 있도록 Go 언어 오픈 소스 프로젝트 5개를 선택했습니다. 기술 세계를 탐험할 수 있도록 Go 언어 오픈 소스 프로젝트 5개를 선택했습니다. Jan 30, 2024 am 09:08 AM

오늘날 급속한 기술 발전의 시대에 프로그래밍 언어는 비가 내린 뒤 버섯처럼 솟아오르고 있습니다. 많은 주목을 받고 있는 언어 중 하나가 바로 Go 언어인데, 단순성, 효율성, 동시성 안전성 등 다양한 기능으로 많은 개발자들에게 사랑을 받고 있습니다. Go 언어는 뛰어난 오픈 소스 프로젝트가 많이 포함된 강력한 생태계로 유명합니다. 이 기사에서는 선택된 Go 언어 오픈 소스 프로젝트 5개를 소개하고 독자가 Go 언어 오픈 소스 프로젝트의 세계를 탐색하도록 안내합니다. KubernetesKubernetes는 자동화를 위한 오픈 소스 컨테이너 오케스트레이션 엔진입니다.

Go 언어 개발 필수 사항: 인기 있는 프레임워크 권장 사항 5가지 Go 언어 개발 필수 사항: 인기 있는 프레임워크 권장 사항 5가지 Mar 24, 2024 pm 01:15 PM

"Go 언어 개발 필수 사항: 5가지 인기 프레임워크 권장 사항" 빠르고 효율적인 프로그래밍 언어인 Go 언어는 점점 더 많은 개발자들이 선호하고 있습니다. 개발 효율성을 높이고 코드 구조를 최적화하기 위해 많은 개발자는 프레임워크를 사용하여 애플리케이션을 빠르게 구축하는 방법을 선택합니다. Go 언어의 세계에는 선택할 수 있는 훌륭한 프레임워크가 많이 있습니다. 이 기사에서는 인기 있는 Go 언어 프레임워크 5개를 소개하고 독자가 이러한 프레임워크를 더 잘 이해하고 사용할 수 있도록 구체적인 코드 예제를 제공합니다. 1.GinGin은 빠른 속도를 갖춘 경량 웹 프레임워크입니다.

Golang의 웹 프레임워크인 Echo 프레임워크를 사용하여 분산 작업 스케줄링 구현 Golang의 웹 프레임워크인 Echo 프레임워크를 사용하여 분산 작업 스케줄링 구현 Jun 24, 2023 am 11:49 AM

인터넷의 발달과 정보기술의 발달로 빅데이터 시대가 도래하면서 데이터 분석, 머신러닝 등의 분야도 널리 활용되고 있다. 이러한 분야에서 작업 스케줄링은 피할 수 없는 문제입니다. 효율적인 작업 스케줄링을 달성하는 방법은 효율성을 향상시키는 데 중요합니다. 이 글에서는 Golang의 웹 프레임워크인 Echo 프레임워크를 사용하여 분산 작업 스케줄링을 구현하는 방법을 소개합니다. 1. Echo 프레임워크 소개 Echo는 확장성이 뛰어나고 가벼운 고성능 GoWeb 프레임워크입니다. HTTP를 기반으로 합니다.

Laravel 개발: Laravel Echo 및 Pusher를 사용하여 WebSocket 통신을 구현하는 방법은 무엇입니까? Laravel 개발: Laravel Echo 및 Pusher를 사용하여 WebSocket 통신을 구현하는 방법은 무엇입니까? Jun 13, 2023 pm 05:01 PM

Laravel은 확장성이 뛰어나고 효율적인 인기 있는 PHP 프레임워크로 개발자가 고품질 웹 애플리케이션을 신속하게 구축할 수 있는 많은 강력한 도구와 라이브러리를 제공합니다. 그중 LaravelEcho와 Pusher는 WebSocket 통신을 쉽게 구현할 수 있는 두 가지 매우 중요한 도구입니다. 이 기사에서는 Laravel 애플리케이션에서 이 두 도구를 사용하는 방법을 자세히 설명합니다. WebSocket이란 무엇입니까? 웹소켓

PHP에서 echo 키워드의 역할과 사용법에 대한 자세한 설명 PHP에서 echo 키워드의 역할과 사용법에 대한 자세한 설명 Jun 28, 2023 pm 08:12 PM

PHP에서 echo 키워드의 역할과 사용법에 대한 자세한 설명 PHP는 널리 사용되는 서버측 스크립트 언어로 웹 개발에 널리 사용됩니다. echo 키워드는 PHP에서 내용을 출력하는 데 사용되는 메서드입니다. 이번 글에서는 echo 키워드의 기능과 사용법을 자세히 소개하겠습니다. 기능: echo 키워드의 주요 기능은 콘텐츠를 브라우저에 출력하는 것입니다. 웹 개발에서는 데이터를 프런트엔드 페이지에 동적으로 표시해야 합니다. 이때 echo 키워드를 사용하여 데이터를 페이지에 출력할 수 있습니다. 이자형

Go 언어 프레임워크 살펴보기: 놓칠 수 없는 5가지 선택! Go 언어 프레임워크 살펴보기: 놓칠 수 없는 5가지 선택! Feb 19, 2024 pm 02:29 PM

빠르고 효율적인 프로그래밍 언어인 Go 언어는 항상 프로그래머들이 선호해 왔습니다. Go 언어 생태계에서 프레임워크는 개발자가 애플리케이션을 더 빠르게 구축하는 데 중요한 역할을 합니다. 이 글에서는 다섯 가지 Go 언어 프레임워크를 소개하여 해당 프레임워크의 특징과 사용법을 이해할 수 있도록 하겠습니다. 1. Gin 프레임워크 Gin 프레임워크는 빠르고 고성능 특성을 갖춘 경량 웹 프레임워크입니다. Gin 프레임워크를 사용하여 RESTful API 및 웹 애플리케이션을 빠르게 구축하세요. 다음은 간단한 예제 코드입니다:

시장에서 가장 인기 있는 golang 프레임워크는 무엇입니까? 시장에서 가장 인기 있는 golang 프레임워크는 무엇입니까? Jun 01, 2024 pm 08:05 PM

현재 가장 인기 있는 Go 프레임워크는 다음과 같습니다. Gin: 가볍고 고성능 웹 프레임워크이며 간단하고 사용하기 쉽습니다. Echo: 고성능 라우팅 및 미들웨어를 제공하는 빠르고 사용자 정의가 가능한 웹 프레임워크입니다. GorillaMux: 고급 라우팅 구성 옵션을 제공하는 빠르고 유연한 멀티플렉서입니다. Fiber: 높은 동시 요청을 처리하는 성능 최적화된 고성능 웹 프레임워크입니다. Martini: 풍부한 기능 세트를 제공하는 객체 지향 디자인을 갖춘 모듈식 웹 프레임워크입니다.

See all articles