Heim Backend-Entwicklung PHP-Tutorial php判断是不是为中文正则表达式大全(转)

php判断是不是为中文正则表达式大全(转)

Jun 13, 2016 pm 01:06 PM
count echo match str

php判断是否为中文正则表达式大全(转)

转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html

?

?

php判断是否为中文正则表达式大全

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???

?

编码范围1. GBK (GB2312/GB18030)???
\x00-\xff GBK双字节编码范围???
\x20-\x7f ASCII???
\xa1-\xff 中文???
\x80-\xff 中文??
??
2. UTF-8 (Unicode)???
\u4e00-\u9fa5 (中文)???
\x3130-\x318F (韩文???
\xAC00-\xD7A3 (韩文)???
\u0800-\u4e00 (日文)???
ps: 韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???

?

?

  1. //判断内容里有没有中文-GBK?(PHP)????? ??
  2. function ?check_is_chinese( $s ){????? ??
  3. ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
  4. }????? ??
  5. ??? ??
  6. //获取字符串长度-GBK?(PHP)????? ??
  7. function ?gb_strlen( $str ){????? ??
  8. ????? $count ?=?0;????? ??
  9. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  10. ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
  11. ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
  12. ???????????++ $count ;????? ??
  13. ?????}????? ??
  14. ????? return ? $count ;????? ??
  15. }????? ??
  16. ??? ??
  17. //截取字符串字串-GBK?(PHP)????? ??
  18. function ?gb_substr( $str ,? $len ){????? ??
  19. ????? $count ?=?0;????? ??
  20. ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
  21. ????????? if ( $count ?==? $len )? break ;????? ??
  22. ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
  23. ???????????++ $count ;????????????? ??
  24. ?????}????? ??
  25. ????? return ? substr ( $str ,?0,? $i );????? ??
  26. }????? ??
  27. ??? ??
  28. //统计字符串长度-UTF8?(PHP)????? ??
  29. function ?utf8_strlen( $str )?{????? ??
  30. ????? $count ?=?0;????? ??
  31. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  32. ????????? $value ?=?ord( $str [ $i ]);????? ??
  33. ????????? if ( $value ?>?127)?{????? ??
  34. ????????????? $count ++;????? ??
  35. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  36. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  37. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  38. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  39. ?????????}????? ??
  40. ????????? $count ++;????? ??
  41. ?????}????? ??
  42. ????? return ? $count ;????? ??
  43. }????? ??
  44. ??? ??
  45. ??? ??
  46. //截取字符串-UTF8(PHP)????? ??
  47. function ?utf8_substr( $str , $position , $length ){????? ??
  48. ????? $start_position ?=? strlen ( $str );????? ??
  49. ????? $start_byte ?=?0;????? ??
  50. ????? $end_position ?=? strlen ( $str );????? ??
  51. ????? $count ?=?0;????? ??
  52. ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
  53. ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
  54. ????????????? $start_position ?=? $i ;????? ??
  55. ????????????? $start_byte ?=? $count ;????? ??
  56. ?????????}????? ??
  57. ????????? if (( $count - $start_byte )>= $length )?{????? ??
  58. ????????????? $end_position ?=? $i ;????? ??
  59. ????????????? break ;????? ??
  60. ?????????}????????? ??
  61. ????????? $value ?=?ord( $str [ $i ]);????? ??
  62. ????????? if ( $value ?>?127){????? ??
  63. ????????????? $count ++;????? ??
  64. ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
  65. ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
  66. ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
  67. ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
  68. ?????????}????? ??
  69. ????????? $count ++;????? ??
  70. ??? ??
  71. ?????}????? ??
  72. ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
  73. }????? ??
  74. ??? ??
  75. //判断是否是有韩文-UTF-8?(JavaScript)????? ??
  76. function ?checkKoreaChar(str)?{????? ??
  77. ????? for (i=0;?i
  78. ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
  79. ????????????? return ?true;????? ??
  80. ?????????}????? ??
  81. ?????}????? ??
  82. ????? return ?false;????? ??
  83. }????? ??
  84. ??? ??
  85. //判断是否有中文字符-GBK?(JavaScript)????? ??
  86. function ?check_chinese_char(s){????? ??
  87. ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
  88. }???

?

UTF-8匹配:

在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}

php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。

重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释

php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,

同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错


网上只能找到匹配全角字符的正则:?? ^[\x80-\xff]*^/??? ,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}

知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)

$action = trim($_GET['action']);
if($action == "sub")
{
??? $str = $_POST['dir'];???
??? //if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式
??? if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))?? //UTF-8汉字字母数字下划线正则表达式
??? {??
??????? echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
??????? echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>


输入字符(数字,字母,汉字,下划线):
???
???


GBK:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式

?


$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>



$str = "中国";
echo $str;
echo "


";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>


如果想判断一个字符串内是否有含有中文,请用下面的代码:

if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}

?

?

?

?

?

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Der Unterschied zwischen counta und count Der Unterschied zwischen counta und count Nov 20, 2023 am 10:01 AM

Mit der Count-Funktion wird die Anzahl der Zahlen in einem angegebenen Bereich gezählt. Sie ignoriert Text, logische Werte und Nullwerte, zählt jedoch leere Zellen. Die Count-Funktion zählt nur die Anzahl der Zellen, die tatsächliche Zahlen enthalten. Die Funktion CountA wird verwendet, um die Anzahl der nicht leeren Zellen in einem angegebenen Bereich zu zählen. Es zählt nicht nur Zellen, die tatsächliche Zahlen enthalten, sondern auch die Anzahl nicht leerer Zellen, die Text, logische Werte und Formeln enthalten.

Fünf ausgewählte Open-Source-Projekte in der Go-Sprache, mit denen Sie die Welt der Technologie erkunden können Fünf ausgewählte Open-Source-Projekte in der Go-Sprache, mit denen Sie die Welt der Technologie erkunden können Jan 30, 2024 am 09:08 AM

Im heutigen Zeitalter der rasanten technologischen Entwicklung schießen Programmiersprachen wie Pilze nach einem Regenschauer aus dem Boden. Eine der Sprachen, die viel Aufmerksamkeit erregt hat, ist die Go-Sprache, die von vielen Entwicklern wegen ihrer Einfachheit, Effizienz, Parallelitätssicherheit und anderen Funktionen geliebt wird. Die Go-Sprache ist für ihr starkes Ökosystem mit vielen hervorragenden Open-Source-Projekten bekannt. In diesem Artikel werden fünf ausgewählte Open-Source-Projekte für die Go-Sprache vorgestellt und der Leser soll die Welt der Open-Source-Projekte für die Go-Sprache erkunden. KubernetesKubernetes ist eine Open-Source-Container-Orchestrierungs-Engine für die Automatisierung

Go-Grundlagen zur Sprachentwicklung: 5 beliebte Framework-Empfehlungen Go-Grundlagen zur Sprachentwicklung: 5 beliebte Framework-Empfehlungen Mar 24, 2024 pm 01:15 PM

„Grundlagen der Go-Sprachentwicklung: 5 beliebte Framework-Empfehlungen“ Als schnelle und effiziente Programmiersprache wird die Go-Sprache von immer mehr Entwicklern bevorzugt. Um die Entwicklungseffizienz zu verbessern und die Codestruktur zu optimieren, entscheiden sich viele Entwickler für die Verwendung von Frameworks, um Anwendungen schnell zu erstellen. In der Welt der Go-Sprache stehen viele hervorragende Frameworks zur Auswahl. In diesem Artikel werden fünf beliebte Go-Sprach-Frameworks vorgestellt und spezifische Codebeispiele bereitgestellt, um den Lesern zu helfen, diese Frameworks besser zu verstehen und zu verwenden. 1.GinGin ist ein leichtes Web-Framework mit hoher Geschwindigkeit

Implementierung der verteilten Aufgabenplanung mit Golangs Web-Framework Echo-Framework Implementierung der verteilten Aufgabenplanung mit Golangs Web-Framework Echo-Framework Jun 24, 2023 am 11:49 AM

Mit der Entwicklung des Internets und der Weiterentwicklung der Informationstechnologie ist das Zeitalter von Big Data angebrochen, und auch Bereiche wie Datenanalyse und maschinelles Lernen sind weit verbreitet. In diesen Bereichen ist die Aufgabenplanung ein unvermeidliches Problem. Für die Verbesserung der Effizienz ist es von entscheidender Bedeutung, eine effiziente Aufgabenplanung zu erreichen. In diesem Artikel stellen wir vor, wie Sie das Web-Framework Echo-Framework von Golang verwenden, um eine verteilte Aufgabenplanung zu implementieren. 1. Einführung in das Echo-Framework Echo ist ein leistungsstarkes, skalierbares und leichtes GoWeb-Framework. Es basiert auf HTTP

Laravel-Entwicklung: Wie implementiert man die WebSockets-Kommunikation mit Laravel Echo und Pusher? Laravel-Entwicklung: Wie implementiert man die WebSockets-Kommunikation mit Laravel Echo und Pusher? Jun 13, 2023 pm 05:01 PM

Laravel ist ein beliebtes PHP-Framework, das hoch skalierbar und effizient ist. Es bietet viele leistungsstarke Tools und Bibliotheken, die es Entwicklern ermöglichen, schnell hochwertige Webanwendungen zu erstellen. Darunter sind LaravelEcho und Pusher zwei sehr wichtige Tools, mit denen die WebSockets-Kommunikation einfach implementiert werden kann. In diesem Artikel wird detailliert beschrieben, wie diese beiden Tools in Laravel-Anwendungen verwendet werden. Was sind WebSockets? WebSockets

Detaillierte Erläuterung der Rolle und Verwendung des Schlüsselworts echo in PHP Detaillierte Erläuterung der Rolle und Verwendung des Schlüsselworts echo in PHP Jun 28, 2023 pm 08:12 PM

Ausführliche Erklärung der Rolle und Verwendung des Schlüsselworts echo in PHP PHP ist eine weit verbreitete serverseitige Skriptsprache, die häufig in der Webentwicklung verwendet wird. Das Schlüsselwort echo ist eine Methode zur Ausgabe von Inhalten in PHP. In diesem Artikel werden die Funktion und Verwendung des Schlüsselworts echo ausführlich vorgestellt. Funktion: Die Hauptfunktion des Schlüsselworts echo besteht darin, Inhalte an den Browser auszugeben. Bei der Webentwicklung müssen wir Daten dynamisch auf der Front-End-Seite präsentieren. Zu diesem Zeitpunkt können wir das Schlüsselwort echo verwenden, um die Daten auf der Seite auszugeben. e

Entdecken Sie das Go-Sprach-Framework: 5 Optionen, die Sie nicht verpassen sollten! Entdecken Sie das Go-Sprach-Framework: 5 Optionen, die Sie nicht verpassen sollten! Feb 19, 2024 pm 02:29 PM

Als schnelle und effiziente Programmiersprache wurde die Go-Sprache schon immer von Programmierern bevorzugt. Im Go-Sprachökosystem spielen Frameworks eine wichtige Rolle dabei, Entwicklern dabei zu helfen, Anwendungen schneller zu erstellen. In diesem Artikel werden fünf Go-Sprachframeworks vorgestellt, damit Sie deren Eigenschaften und Verwendung verstehen. 1. Gin-Framework Das Gin-Framework ist ein leichtes Web-Framework mit schnellen und leistungsstarken Eigenschaften. Verwenden Sie das Gin-Framework, um schnell RESTful-APIs und Webanwendungen zu erstellen. Hier ist ein einfacher Beispielcode:

Was sind die beliebtesten Golang-Frameworks auf dem Markt? Was sind die beliebtesten Golang-Frameworks auf dem Markt? Jun 01, 2024 pm 08:05 PM

Die derzeit beliebtesten Go-Frameworks sind: Gin: leichtes, leistungsstarkes Web-Framework, einfach und benutzerfreundlich. Echo: Ein schnelles, hochgradig anpassbares Web-Framework, das leistungsstarkes Routing und Middleware bietet. GorillaMux: Ein schneller und flexibler Multiplexer, der erweiterte Routing-Konfigurationsoptionen bietet. Fiber: Ein leistungsoptimiertes, leistungsstarkes Web-Framework, das viele gleichzeitige Anfragen verarbeitet. Martini: Ein modulares Web-Framework mit objektorientiertem Design, das einen umfangreichen Funktionsumfang bietet.

See all articles