php判断是不是为中文正则表达式大全(转)
php判断是否为中文正则表达式大全(转)
转载自?? http://www.cnblogs.com/DavidYan/articles/2032115.html
?
?
php判断是否为中文正则表达式大全
?
$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>
$str = "中国";
echo $str;
echo "
";
//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) {
//只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>
如果想判断一个字符串内是否有含有中文,请用下面的代码:
if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}
判断中文和编码有关 gbk是双字节,utf8是三字节,可以根据中文的范围来判断???
?
编码范围1. GBK
(GB2312/GB18030)???
\x00-\xff
GBK双字节编码范围???
\x20-\x7f
ASCII???
\xa1-\xff
中文???
\x80-\xff 中文??
??
2. UTF-8
(Unicode)???
\u4e00-\u9fa5
(中文)???
\x3130-\x318F
(韩文???
\xAC00-\xD7A3
(韩文)???
\u0800-\u4e00
(日文)???
ps:
韩文是大于[\u9fa5]的字符???
正则例子:???
preg_replace(”/([\x80-\xff])/”,”",$str);??
preg_replace(”/([u4e00-u9fa5])/”,”",$str);???
?
?
- //判断内容里有没有中文-GBK?(PHP)????? ??
- function ?check_is_chinese( $s ){????? ??
- ????? return ?preg_match( '/[\x80-\xff]./' ,? $s );????? ??
- }????? ??
- ??? ??
- //获取字符串长度-GBK?(PHP)????? ??
- function ?gb_strlen( $str ){????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
- ????????? $s ?=? substr ( $str ,? $i ,?1);????? ??
- ????????? if ?(preg_match( "/[\x80-\xff]/" ,? $s ))?++ $i ;????? ??
- ???????????++ $count ;????? ??
- ?????}????? ??
- ????? return ? $count ;????? ??
- }????? ??
- ??? ??
- //截取字符串字串-GBK?(PHP)????? ??
- function ?gb_substr( $str ,? $len ){????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i =0;? $i strlen ( $str );? $i ++){????? ??
- ????????? if ( $count ?==? $len )? break ;????? ??
- ????????? if (preg_match( "/[\x80-\xff]/" ,? substr ( $str ,? $i ,?1)))?++ $i ;????? ??
- ???????????++ $count ;????????????? ??
- ?????}????? ??
- ????? return ? substr ( $str ,?0,? $i );????? ??
- }????? ??
- ??? ??
- //统计字符串长度-UTF8?(PHP)????? ??
- function ?utf8_strlen( $str )?{????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
- ????????? $value ?=?ord( $str [ $i ]);????? ??
- ????????? if ( $value ?>?127)?{????? ??
- ????????????? $count ++;????? ??
- ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
- ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
- ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
- ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
- ?????????}????? ??
- ????????? $count ++;????? ??
- ?????}????? ??
- ????? return ? $count ;????? ??
- }????? ??
- ??? ??
- ??? ??
- //截取字符串-UTF8(PHP)????? ??
- function ?utf8_substr( $str , $position , $length ){????? ??
- ????? $start_position ?=? strlen ( $str );????? ??
- ????? $start_byte ?=?0;????? ??
- ????? $end_position ?=? strlen ( $str );????? ??
- ????? $count ?=?0;????? ??
- ????? for ( $i ?=?0;? $i ? strlen ( $str );? $i ++){????? ??
- ????????? if ( $count ?>=? $position ?&&? $start_position ?>? $i ){????? ??
- ????????????? $start_position ?=? $i ;????? ??
- ????????????? $start_byte ?=? $count ;????? ??
- ?????????}????? ??
- ????????? if (( $count - $start_byte )>= $length )?{????? ??
- ????????????? $end_position ?=? $i ;????? ??
- ????????????? break ;????? ??
- ?????????}????????? ??
- ????????? $value ?=?ord( $str [ $i ]);????? ??
- ????????? if ( $value ?>?127){????? ??
- ????????????? $count ++;????? ??
- ????????????? if ( $value ?>=?192?&&? $value ? $i ++;????? ??
- ????????????? elseif ( $value ?>=?224?&&? $value ? $i ?=? $i ?+?2;????? ??
- ????????????? elseif ( $value ?>=?240?&&? $value ? $i ?=? $i ?+?3;????? ??
- ????????????? else ? die ( 'Not?a?UTF-8?compatible?string' );????? ??
- ?????????}????? ??
- ????????? $count ++;????? ??
- ??? ??
- ?????}????? ??
- ????? return ( substr ( $str , $start_position , $end_position - $start_position ));????? ??
- }????? ??
- ??? ??
- //判断是否是有韩文-UTF-8?(JavaScript)????? ??
- function ?checkKoreaChar(str)?{????? ??
-
?????
for
(i=0;?i
- ????????? if (((str.charCodeAt(i)?>?0x3130?&&?str.charCodeAt(i)?0x318F)?||?(str.charCodeAt(i)?>=?0xAC00?&&?str.charCodeAt(i)?
- ????????????? return ?true;????? ??
- ?????????}????? ??
- ?????}????? ??
- ????? return ?false;????? ??
- }????? ??
- ??? ??
- //判断是否有中文字符-GBK?(JavaScript)????? ??
- function ?check_chinese_char(s){????? ??
- ????? return ?(s.length?!=?s.replace(/[^\x00-\xff]/g, "**" ).length);????? ??
- }???
?
UTF-8匹配:
在javascript中,要判断字符串是中文是很简单的。比如:
var str = "php编程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("该字符串全部是中文");
}
else{
alert("该字符串不全部是中文");
}
php中,是用\x表示十六进制数据的。于是,变换成如下的代码:
$str = "php编程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
貌似不报错了,判断的结果也正确,不过把$str换成“编程”两字,结果却还是显示“该字符串不全部是中文”,看来这样的判断还是不够准确。
重要:查阅了发现,对于[\x4e00-\x9fa5]这块东西,自己做一个强化的解释
php的正则中, [\x4e00-\x9fa5],其实就是 字符和字符组的概念, \x{hex},表达一个16进制数, 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必须加上大括号,
同时,如果是大于x{FF}的hex,必须和u 修饰符连用,不然会非法出错
网上只能找到匹配全角字符的正则:??
^[\x80-\xff]*^/???
,这里可以不加大括号
[\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持???
不过,既然\x表示的十六进制数据,为什么和js里边提供的范围\x4e00-\x9fa5不一样呢?于是我就换成了下边的代码,发现真的准确了:
$str = "php编程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("该字符串全部是中文");
} else {
print("该字符串不全部是中文");
}
知道了php中utf-8编码下用正则表达式匹配汉字的最终正确表达式――/^[\x{4e00}-\x{9fa5}]+$/u,
参考以上文章写了如下一段测试代码(复制以下代码保存成.php文件)
$action = trim($_GET['action']);
if($action == "sub")
{
??? $str =
$_POST['dir'];???
???
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str))
//GB2312汉字字母数字下划线正则表达式
???
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))??
//UTF-8汉字字母数字下划线正则表达式
???
{??
???????
echo "您输入的[".$str."]含有违法字符";??
??? }
??? else
??? {
???????
echo "您输入的[".$str."]完全合法,通过!";??
??? }
}
?>
GBK:
preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312汉字字母数字下划线正则表达式
?
$str="aaa";
if(!eregi("[^\x80-\xff]","$str"))
{
echo "是";
}
else
{
echo "不是";
}
?>
$str = "中国";
echo $str;
echo "
";
//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) {
//只能在GB2312情况下使用
if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
echo "正确输入";
} else {
echo "错误输入";
}
?>
如果想判断一个字符串内是否有含有中文,请用下面的代码:
if (preg_match("/[\x7f-\xff]/", $string)) {
echo "有中文";
}else{
echo "没有中文";
}
?
?
?
?
?

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Mit der Count-Funktion wird die Anzahl der Zahlen in einem angegebenen Bereich gezählt. Sie ignoriert Text, logische Werte und Nullwerte, zählt jedoch leere Zellen. Die Count-Funktion zählt nur die Anzahl der Zellen, die tatsächliche Zahlen enthalten. Die Funktion CountA wird verwendet, um die Anzahl der nicht leeren Zellen in einem angegebenen Bereich zu zählen. Es zählt nicht nur Zellen, die tatsächliche Zahlen enthalten, sondern auch die Anzahl nicht leerer Zellen, die Text, logische Werte und Formeln enthalten.

Im heutigen Zeitalter der rasanten technologischen Entwicklung schießen Programmiersprachen wie Pilze nach einem Regenschauer aus dem Boden. Eine der Sprachen, die viel Aufmerksamkeit erregt hat, ist die Go-Sprache, die von vielen Entwicklern wegen ihrer Einfachheit, Effizienz, Parallelitätssicherheit und anderen Funktionen geliebt wird. Die Go-Sprache ist für ihr starkes Ökosystem mit vielen hervorragenden Open-Source-Projekten bekannt. In diesem Artikel werden fünf ausgewählte Open-Source-Projekte für die Go-Sprache vorgestellt und der Leser soll die Welt der Open-Source-Projekte für die Go-Sprache erkunden. KubernetesKubernetes ist eine Open-Source-Container-Orchestrierungs-Engine für die Automatisierung

„Grundlagen der Go-Sprachentwicklung: 5 beliebte Framework-Empfehlungen“ Als schnelle und effiziente Programmiersprache wird die Go-Sprache von immer mehr Entwicklern bevorzugt. Um die Entwicklungseffizienz zu verbessern und die Codestruktur zu optimieren, entscheiden sich viele Entwickler für die Verwendung von Frameworks, um Anwendungen schnell zu erstellen. In der Welt der Go-Sprache stehen viele hervorragende Frameworks zur Auswahl. In diesem Artikel werden fünf beliebte Go-Sprach-Frameworks vorgestellt und spezifische Codebeispiele bereitgestellt, um den Lesern zu helfen, diese Frameworks besser zu verstehen und zu verwenden. 1.GinGin ist ein leichtes Web-Framework mit hoher Geschwindigkeit

Mit der Entwicklung des Internets und der Weiterentwicklung der Informationstechnologie ist das Zeitalter von Big Data angebrochen, und auch Bereiche wie Datenanalyse und maschinelles Lernen sind weit verbreitet. In diesen Bereichen ist die Aufgabenplanung ein unvermeidliches Problem. Für die Verbesserung der Effizienz ist es von entscheidender Bedeutung, eine effiziente Aufgabenplanung zu erreichen. In diesem Artikel stellen wir vor, wie Sie das Web-Framework Echo-Framework von Golang verwenden, um eine verteilte Aufgabenplanung zu implementieren. 1. Einführung in das Echo-Framework Echo ist ein leistungsstarkes, skalierbares und leichtes GoWeb-Framework. Es basiert auf HTTP

Laravel ist ein beliebtes PHP-Framework, das hoch skalierbar und effizient ist. Es bietet viele leistungsstarke Tools und Bibliotheken, die es Entwicklern ermöglichen, schnell hochwertige Webanwendungen zu erstellen. Darunter sind LaravelEcho und Pusher zwei sehr wichtige Tools, mit denen die WebSockets-Kommunikation einfach implementiert werden kann. In diesem Artikel wird detailliert beschrieben, wie diese beiden Tools in Laravel-Anwendungen verwendet werden. Was sind WebSockets? WebSockets

Ausführliche Erklärung der Rolle und Verwendung des Schlüsselworts echo in PHP PHP ist eine weit verbreitete serverseitige Skriptsprache, die häufig in der Webentwicklung verwendet wird. Das Schlüsselwort echo ist eine Methode zur Ausgabe von Inhalten in PHP. In diesem Artikel werden die Funktion und Verwendung des Schlüsselworts echo ausführlich vorgestellt. Funktion: Die Hauptfunktion des Schlüsselworts echo besteht darin, Inhalte an den Browser auszugeben. Bei der Webentwicklung müssen wir Daten dynamisch auf der Front-End-Seite präsentieren. Zu diesem Zeitpunkt können wir das Schlüsselwort echo verwenden, um die Daten auf der Seite auszugeben. e

Als schnelle und effiziente Programmiersprache wurde die Go-Sprache schon immer von Programmierern bevorzugt. Im Go-Sprachökosystem spielen Frameworks eine wichtige Rolle dabei, Entwicklern dabei zu helfen, Anwendungen schneller zu erstellen. In diesem Artikel werden fünf Go-Sprachframeworks vorgestellt, damit Sie deren Eigenschaften und Verwendung verstehen. 1. Gin-Framework Das Gin-Framework ist ein leichtes Web-Framework mit schnellen und leistungsstarken Eigenschaften. Verwenden Sie das Gin-Framework, um schnell RESTful-APIs und Webanwendungen zu erstellen. Hier ist ein einfacher Beispielcode:

Die derzeit beliebtesten Go-Frameworks sind: Gin: leichtes, leistungsstarkes Web-Framework, einfach und benutzerfreundlich. Echo: Ein schnelles, hochgradig anpassbares Web-Framework, das leistungsstarkes Routing und Middleware bietet. GorillaMux: Ein schneller und flexibler Multiplexer, der erweiterte Routing-Konfigurationsoptionen bietet. Fiber: Ein leistungsoptimiertes, leistungsstarkes Web-Framework, das viele gleichzeitige Anfragen verarbeitet. Martini: Ein modulares Web-Framework mit objektorientiertem Design, das einen umfangreichen Funktionsumfang bietet.
