php教程 php手册 经常用到的PHP正则表达达式

经常用到的PHP正则表达达式

Jun 21, 2016 am 08:51 AM
quot regex str

  思维导图

  介绍

  正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如javascript,java,.net,php等等,我今天就把我对正则表达式的理解跟大家唠唠,不当之处,请多多指教!

  需要知道的术语——下面的术语你知道多少?

  定界符;字符域;修饰符;限定符;脱字符;通配符(正向预查,反向预查);反向引用;惰性匹配;注释;零字符宽

  定位

  我们什么时候使用正则表达式呢?不是所有的字符操作都用正则就好了,php在某些方面用正则反而影响效率。当我们遇到复杂文本数据的解析时候,用正则是比较好的选择。

  优点

  正则表达式在处理复杂字符操作的时候,可以提高工作效率,也在一定程度节省你的代码量。

  缺点

  我们在使用正则表达式的时候,复杂的正则表达式会加大代码的复杂度,让人很难理解。所以我们有的时候需要在正则表达式内部添加注释。

  通用模式

  定界符,通常使用 "/"做为定界符开始和结束,也可以使用"#"。

  什么时候使用"#"呢?一般是在你的字符串中有很多"/"字符的时候,因为正则的时候这种字符需要转义,比如uri。

  使用"/"定界符的代码如下.

  $regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i';

  $str = 'http://www.youku.com/show_page/id_ABCDEFG.html';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  preg_match中的$matches[0]将包含与整个模式匹配的字符串。

  使用"#"定界符的代码如下.这个时候对"/"就不转义!

  $regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i';

  $str = 'http://www.youku.com/show_page/id_ABCDEFG.html';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  修饰符:用于改变正则表达式的行为。

  我们看到的('/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html/i')中的最后一个"i"就是修饰符,表示忽略大小写,还有一个我们经常用到的是"x"表示忽略空格。

  贡献代码:

  $regex = '/HELLO/';

  $str = 'hello word';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  echo 'No i:Valid Successful!',"\n";

  }

  if(preg_match($regex.'i', $str, $matches)){

  echo 'YES i:Valid Successful!',"\n";

  }

  字符域:[\w]用方括号扩起来的部分就是字符域。

  限定符:如[\w]{3,5}或者[\w]*或者[\w]+这些[\w]后面的符号都表示限定符。现介绍具体意义。

  {3,5}表示3到5个字符。{3,}超过3个字符,{,5}最多5个,{3}三个字符。* 表示0到多个,+ 表示1到多个。

  脱字符号

  放在字符域(如:[^\w])中表示否定(不包括的意思)——“反向选择”

  放在表达式之前,表示以当前这个字符开始。(/^n/i,表示以n开头)。

  注意,我们经常管"\"叫"跳脱字符"。用于转义一些特殊符号,如".","/"

 

  通配符(lookarounds):断言某些字符串中某些字符的存在与否!

  lookarounds分两种:lookaheads(正向预查 ?=)和lookbehinds(反向预查?

  格式:

  正向预查:(?=) 相对应的 (?!)表示否定意思;反向预查:(?

  前后紧跟字符

  $regex = '/(?

  $str = 'abcdefgk';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  否定意义:

  $regex = '/(?

  $str = 'abcdefgk';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

 

  字符宽度:零

  验证零字符代

  $regex = '/HE(?=L)LO/i';

  $str = 'HELLO';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  打印不出结果!

  $regex = '/HE(?=L)LLO/i';

  $str = 'HELLO';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  能打印出结果!

  说明:(?=L)意思是HE后面紧跟一个L字符。但是(?=L)本身不占字符,要与(L)区分,(L)本身占一个字符。

 

  捕获数据

  没有指明类型而进行的分组,将会被获取,供以后使用。

  指明类型指的是通配符。所以只有圆括号起始位置没有问号的才能被捕捉。

  在同一个表达式内的引用叫做反向引用。

  调用格式: \编号(如\1)。

  $regex = '/^(Chuanshanjia)[\w\s!]+\1$/';

  $str = 'Chuanshanjia thank Chuanshanjia';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  避免捕获数据

  格式:(?:pattern)

  优点:将使有效反向引用数量保持在最小,代码更加、清楚。

  命名捕获组

  格式:(?P) 调用方式 (?P=组名)

  $regex = '/(?Pchuanshanjia)[\s]Is[\s](?P=author)/i';

  $str = 'author:chuanshanjia Is chuanshanjia';

  $matches = array();

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  运行结果

 

  惰性匹配(记住:会进行两部操作,请看下面的原理部分)

  格式:限定符?

  原理:"?":如果前面有限定符,会使用最小的数据。如“*”会取0个,而“+”会取1个,如过是{3,5}会取3个。

  先看下面的两个代码:

  代码1.

  $regex = '/heL*/i';

  $str = 'heLLLLLLLLLLLLLLLL';

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  结果1.

  代码2

  $regex = '/heL*?/i';

  $str = 'heLLLLLLLLLLLLLLLL';

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  结果2

  代码3,使用“+”

  $regex = '/heL+?/i';

  $str = 'heLLLLLLLLLLLLLLLL';

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  结果3

  代码4,使用{3,5}

  $regex = '/heL{3,10}?/i';

  $str = 'heLLLLLLLLLLLLLLLL';

  if(preg_match($regex, $str, $matches)){

  var_dump($matches);

  }

  echo "\n";

  结果4

 

  正则表达式的注释

  格式:(?# 注释内容)

  用途:主要用于复杂的注释

  贡献代码:是一个用于连接MYSQL数据库的正则表达式

   $regex = '/
   ^host=(?
   \
   ([\w!@#$%^&*()_+\-]+) (?#用户名)
   \
   ([\w!@#$%^&*()_+\-]+) (?#密码)
   (?!\)$/ix';

   $str = 'host=192.168.10.221root123456';
   $matches = array();

   if(preg_match($regex, $str, $matches)){
   var_dump($matches);
   }

   echo "\n";

 

  原文链接:http://www.cnblogs.com/baochuan/archive/2012/03/12/2391135.html



본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决 php提交表单通过后,弹出的对话框怎样在当前页弹出,该如何解决 Jun 13, 2016 am 10:23 AM

php提交表单通过后,弹出的对话框怎样在当前页弹出php提交表单通过后,弹出的对话框怎样在当前页弹出而不是在空白页弹出?想实现这样的效果:而不是空白页弹出:------解决方案--------------------如果你的验证用PHP在后端,那么就用Ajax;仅供参考:HTML code

Python의 RegEx 정규식을 사용하는 방법 Python의 RegEx 정규식을 사용하는 방법 May 19, 2023 pm 08:49 PM

RegEx 또는 정규 표현식은 검색 패턴을 형성하는 일련의 문자입니다. RegEx를 사용하면 문자열에 지정된 검색 패턴이 포함되어 있는지 확인할 수 있습니다. RegEx 모듈 Python은 정규식을 처리하는 데 사용할 수 있는 re라는 내장 패키지를 제공합니다. re 모듈 가져오기: Python에서 importre RegEx re 모듈을 가져온 후에는 정규식을 사용할 수 있습니다. 예 문자열을 검색하여 "China"로 시작하고 "country"로 끝나는지 확인: importretxt="Chinaisagreatcountry" x =re .search("^중국.*국가$&

Python 내장 유형 str 소스 코드 분석 Python 내장 유형 str 소스 코드 분석 May 09, 2023 pm 02:16 PM

1유니코드 컴퓨터 저장의 기본 단위는 8비트로 구성된 바이트(byte)이다. 영어는 26개의 문자와 여러 개의 기호로만 구성되므로 영어 문자를 바이트 단위로 직접 저장할 수 있습니다. 하지만 다른 언어(예: 중국어, 일본어, 한국어 등)는 문자 수가 많기 때문에 인코딩에 여러 바이트를 사용해야 합니다. 컴퓨터 기술이 확산됨에 따라 비라틴어 문자 인코딩 기술이 계속 발전하고 있지만 여전히 두 가지 주요 제한 사항이 있습니다. 다국어 지원이 불가능합니다. 한 언어의 인코딩 방식을 다른 언어에서 사용할 수 없으며 통일된 표준이 없습니다. 예를 들어 중국어에는 GBK, GB2312, GB18030 등과 같은 여러 인코딩 표준이 있습니다. 인코딩 방법이 통일되어 있지 않기 때문에 개발자는 서로 다른 인코딩 간에 전환해야 하며 많은 오류가 필연적으로 발생합니다.

Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Python에서 __str__과 __repr__의 유사점과 차이점은 무엇입니까? Apr 29, 2023 pm 07:58 PM

__str__과 __repr__의 유사점과 차이점은 무엇입니까? 우리 모두는 문자열 표현을 알고 있습니다. Python의 내장 함수인 repr()은 식별을 용이하게 하기 위해 문자열 형식으로 객체를 표현할 수 있습니다. 이것이 "문자열 표현"입니다. repr()은 특수 메소드 __repr__을 통해 객체의 문자열 표현을 얻습니다. __repr__이 구현되지 않은 경우 벡터의 인스턴스를 콘솔에 인쇄하면 결과 문자열이 구현될 수 있습니다. >>>classExample:pass>>>print(str(Example()))>>>

Go 언어에서 str의 비밀을 밝히다 Go 언어에서 str의 비밀을 밝히다 Mar 29, 2024 am 11:27 AM

Go 언어는 빠르고 간결하며 효율적인 오픈 소스 프로그래밍 언어로, 프로그래머들 사이에서 점점 더 인기를 얻고 있습니다. 문자열은 프로그램에서 자주 사용되는 데이터 타입 중 하나로, Go 언어 특유의 처리 방식도 갖고 있다. 이 글은 독자들이 Go 언어에서 문자열(str)의 신비를 발견하고 구체적인 코드 예제를 통해 그 사용법과 특징을 분석하도록 유도할 것입니다. 문자열 정의 및 초기화 Go 언어에서 문자열은 큰따옴표 ""로 묶인 일련의 문자입니다. 예: str

不用数据库来实现用户的简单的下载,代码如下,但是却不能下载,请高手找下原因,文件路劲什么的没有关问题 不用数据库来实现用户的简单的下载,代码如下,但是却不能下载,请高手找下原因,文件路劲什么的没有关问题 Jun 13, 2016 am 10:15 AM

不用数据库来实现用户的简单的下载,代码如下,但是却不能下载,请高手找下原因,文件路劲什么的没问题。

为什么小弟我在php上写的这个代码,在浏览器上什么都不显示 为什么小弟我在php上写的这个代码,在浏览器上什么都不显示 Jun 13, 2016 am 10:24 AM

为什么我在php上写的这个代码,在浏览器上什么都不显示啊

图片消失怎么解决 图片消失怎么解决 Apr 07, 2024 pm 03:02 PM

图片消失如何解决先是图片文件上传$file=$_FILES['userfile'];  if(is_uploaded_file($file['tmp_name'])){$query=mysql_query("INSERT INTO gdb_banner(image_src ) VALUES ('images/{$file['name'

See all articles