php教程 pcre正则表达式完全教程
预定义常量
preg_pattern_order
结果按照”规则”排序, 仅用于preg_match_all, 即$matches[0]是完整规则的匹配结果, $matches[1]是第一个子组匹配的结果
preg_set_order:
结果按照”集合”排序, 仅用于preg_match_all, 即$matches[0]保存第一次匹配结果的所有结果(包含子组)信息, $matches[1]保存第二次的结果信息
preg_offset_capture
在捕获的结果中, 不仅包含结果子串, 还会包含子串在原字符串中的位置.
preg_split_no_empty
告知preg_split仅返回非空的部分
preg_split_delim_capture
告知preg_split同时捕获规则中的括号表达式匹配到的内容
preg_split_offset_capture
如果设置了这个标记, 每次匹配得到的结果的offset位置将会被同时返回.
preg_no_error
如果preg_last_error调用后返回此值, 则表明正则没有错误
preg_internal_error
如果preg_last_error调用后返回此值, 则表明发生了pcre内部错误
preg_backtrack_limit_error
如果回溯次数超过预设的值, preg_last_error函数返回此值
preg_recursion_limit_error
如果递归次数超过预设的值, preg_last_error函数返回此值
preg_bad_utf8_error
如果preg的最后错误是由于异常的utf-8数据(仅在运行在utf-8模式正则表达式情况下)导致的, 那么preg_last_error返回此值
preg_bad_utf8_offset_error
如果偏移量与合法的utf-8代码(仅在运行在utf-8模式正则表达式情况下)的开始点不匹配, preg_last_error的调用返回此值
pcre_version
返回pcre版本号和发布日期.
模式修饰符
i pcre_classes
大小写不敏感的修饰符
m pcre_multiline
多行匹配, 默认情况下, pcre认为目标字符串是一组单行字符组成的(然而实际上它可能会包含多行). 元字符^仅匹配字符串的开始位置, 而元字符$则仅匹配字符串的末尾, 或者新行之前(除非设置了d修饰符). 这个修饰符和perl中工作一直, 使用后, ^和$会匹配每一行的开始和结尾
如果目标字符串中没有n字符或者模式中没有出现^和$, 则设置此修饰符是没有任何影响的.
s pcre_dotall
用来增强字符类.(点号)的功能, 默认情况下, 点号匹配任意字符, 但不包括换行符及以后内容. 使用此修饰符后, 可以匹配任意字符包括换行符
x pcre_extended
如果设置了这个修饰符, 模式中的空白字符, 除非被转义或者在一个字符类中, 否则都被忽略. 在一个未转义的#之后直到下一个换行符之间的内容都会被正则表达式引擎忽略以方便添加注释.
e preg_replace_eval
使用此修饰符后, preg_replace的$replacement参数除了可以使用正常的反向引用来取得匹配值, 还可以在其中书写eval语法允许的字符串进行求值, 并将返回结果用于最终的替换.
a pcre_anchored
如果设置了此修饰符, 模式被强制成为”anchored”(锚点), 也就是说约束使其始终从字符串的嘴前面开始搜索. 这个影响也可以通过构造适当的规则来实现(perl中只能这样实现)
d pcre_dollar_endonly
如果设置了这个修饰符, $会匹配目标字符串的结尾之前, 而如果没有设置这个修饰符, 如果目标字符串最后一个字符时换行符, $就会匹配该换行符之前而不是字符串结尾之前.
如果设置了m修饰符, 则这个修饰符会被忽略. 这一点和perl不一致
s
当一个模式需要多次使用的时候, 我们为了获得更高的匹配效率, 值得花费一些时间对其进行分析. 如果设置了这个修饰符, 将会进行这个额外的分析. 当前, 这种对一个模式的分析仅仅适用于非锚点的匹配(即没有一个单一固定的开始字符)
u pcre_ungreedy
这个修饰符逆转了贪婪的模式, 如果没有这个设置, 默认情况下的正则匹配时贪婪的, 量词后增加了?的模式是非贪婪的, 但是如果设置了这个修饰符, 则刚好相反.
这个规则与perl是不兼容的.
也可以在模式中使用?u来达到同样的效果
x pcre_extra
这个修饰符启用了一个pcre中与perl不兼容的额外功能. 任意反斜线后面跟一个没有特殊含义的字符会导致一个错误, 以此来保留这些组合以备后期扩展.
默认情况下, 和perl一样, 反斜线后跟一个没有特殊含义的字符会以该字符原意解释.
当前没有任何其他特性受此修饰符控制
j pcre_info_jchanged
与内部选项?j相同, 用来改变本地pcre_dupnames选项. 允许子组有重复的名字
u pcre8
这个修饰符打开一个pcre中与perl不兼容的额外功能. 模式字符串被认为是utf-8的.