用实际的例子揭开正面的神秘面纱-php教程-PHP中文网

正则表达式（REGEX）是开发人员的宝贵工具，用于诸如日志分析，形式提交验证并查找和替换操作之类的任务。了解如何有效构建和使用正则表达式可以大大提高生产率和效率。
包括匹配密码，URL，特定的HTML标签和重复的单词。这些示例证明了字符范围，断言，条件，群体等的使用。
> REGEX是一种强大的工具，但它也可能很复杂且难以管理。因此，有时使用几个较小的正直而不是一个大的正则是更有效的。注意小组捕获也可能使匹配对于进一步的处理更有用。
正则表达式通常用于执行搜索，替换子字符串和验证字符串数据。本文提供了通过复杂的正则表达式进行的提示，技巧，资源和步骤。如果您没有基本技能，则可以通过我们的初学者指南学习正则表达式。作为正则表达式的奥术，您不会花很长时间学习这些概念。有许多书籍，文章，网站来解释正则表达式，因此，我不想写另一个说明，而是要直接进行更实用的例子：

匹配密码

匹配url
匹配特定的HTML标签
匹配重复的单词
您可以在此链接上找到有用的备忘单。除了大量有用的资源外，Lea Verou在这篇文章的底部还有一个会议视频 - 它有点长，但在打破正则表达式方面非常出色。

正则表达式通常在开发人员的日常工作中使用 - 日志分析，形式提交验证，查找和替换等等。这就是为什么每个好的开发人员都应该知道如何使用它们，但是建造好的正则是什么最佳实践是什么？

1。定义方案

使用自然语言来定义问题，将使您更好地了解使用方法。这些单词可以和必须在定义中使用，可用于描述强制性约束或断言。以下是一个示例：

字符串必须以“ H”开头，并以“ O”结束（例如，Hello，Halo）。

字符串可以包裹在括号中。

对问题有很好的定义后，我们可以理解我们的正则表达中涉及的元素类型：

允许的字符类型（字，数字，新行，范围，…）？

一个角色必须出现多少次（一个或多个，一次，…）？在

3。实施/测试/重构

拥有实时测试环境以测试和改善正则表达非常重要。有Regex101.com，Regexr.com和Debuggex.com等网站提供一些最佳环境。为了提高正则效率，您可以尝试回答以下其他问题：

字符类是否正确定义了特定域？

>我应该用子图案，组，条件等重构表达式，以使其更小，更清晰，更灵活？
以下示例的目的不是写一个只能解决问题的表达式，而是使用特定用例，使用字符范围，断言，条件，群体等的重要元素编写最有效的表达式。

设想：

长度

6至12个字符

必须至少有一个大写字母

>必须至少有一个下部案例字母
必须至少有一个数字
应包含其他字符
图案： ^（？=。*[a-z]）（？=。*[a-z]）（？=。*d）。{6,12} $ 此表达式基于多个正lookahead（？=（REGEX））。 LookAhead匹配了一些声明（Regex）的东西。条件的顺序不会影响结果。当有几种条件时，外观表达式非常有用。我们还可以使用负LookAhead（？！（REGEX））排除某些角色范围。例如，我可以将％排除（？！。*＃）。让我们解释以上表达的每种模式：
^在字符串开始时断言位置

（？=。*[a-z]）正lookahead，断言正则是。*[a-z]可以匹配：

。*匹配零和无限时间之间的任何字符（新线）
[A-Z]匹配A和z之间的范围内的一个字符
>
$断言字符串末尾的位置

匹配的URL

设想：

必须从http或https或ftp开始，然后是：//
必须匹配有效的域名
可以包含端口规范（http://www.sitepoint.com:80）
可以包含数字，字母，点，连字符，前向斜线，多次

图案： ^（http | https | ftp）：[/] {2}（[a-za-z0-9--。]。[a-za-z] {2,4}）（：[0-9]）？ /？（[A-ZA-Z0-9 -._？？，'/\＆amp;％$＃=〜]*）*）使用 ^（http | https | ftp）：[/] {2}的第一种情况很容易解决。要匹配域名，我们需要牢记，要有效，它只能包含字母，数字，连字符和点。在我的示例中，我将标点符号后的字符数量从2到4限制在2到4，但可以扩展到.Rocks或。编码等新域。域名匹配（[A-ZA-Z0-9-。]。[A-ZA-Z] {2,4}）。可选端口规范与简单（：[0-9]）？一个URL可以包含多次重复多次的多个斜线和多个字符（请参阅RFC3986），通过在组中使用一系列字符可以匹配（[a-za-Z0-9-._？？，'/\＆amp;％$ ＃=〜]*）。将每个重要元素与组捕获（）匹配非常有用，因为它将仅返回我们需要的匹配项。请记住，某些角色需要逃脱。下面，每个副本都解释了：

^在字符串开始时断言位置
捕获组（http | https | ftp），捕获http或https或ftp
：逃脱的角色，匹配角色：字面意思
[ /] {2}恰好匹配逃脱的字符 /
捕获组（[A-ZA-Z0-9-。]。[A-ZA-Z] {2,4}）：
- [A-ZA-Z0-9-。]匹配A和z，a和z，z，0和9之间的一个和无限的时间字符，字面字符和字符。从字面上看
- [a-za-z] {2,4}匹配A和Z或A和Z之间的2至4倍（CASE敏感）>
- ：匹配字符：字面上
- [0-9]匹配0和9次或多次之间的单个字符
/？匹配字符 /字面零或一次
>捕获组（[a-za-z0-9 -._？？，'/\＆amp;％$＃=〜]*）*）：
[a-za-z0-9 -._？？，'/\＆amp;％$＃=〜]*匹配零和无限时间在a-z，a-z，a-z，0-9的单个字符之间： - ._？，'/＆amp;％$＃=〜。
匹配HTML TAG

设想：

开始标签必须以

>结尾

结尾。
以开始

捕获标签名称

之后是一个或多个炭
捕获标签内的内容
名称必须在>
表达式中只有两个捕获组，标签名称和内容将返回一个非常清晰的匹配，即带有相关内容的标签名称列表。让我们更深入地解释副本：

捕获组（[w]）匹配任何单词字符a-za-z0-9_一次或多次

。*匹配零或更多次之间的任何字符（Newline除外）
>匹配字符>字面上的
捕获组（。

>匹配字符>字面上

匹配重复的单词

设想：

单词是空间分开的

我们必须匹配每个重复 - 非连续性

图案： b（w）b（？=。*1）这种正则表达似乎具有挑战性，但使用了先前显示的一些概念。该模式引入了单词边界的概念。单词边界B主要检查位置。当单词字符（即abcde）之后是非单词字符（即： - 〜，！）时，它与之匹配。在下面，您可以找到单词边界的一些示例用途，以使其更清晰： - 鉴于短语正则表达式很棒 - 模式的准匹配是 - 模式w {3} b可以与单词的最后三个字母匹配：lar，ion，是，ome 以上表达可以解释为：

匹配每个单词字符，后跟一个非字角色（在我们的情况空间中）

>
- 1匹配与首先捕获组相同的文本
如果我们返回所有匹配，而不是仅返回第一个匹配项，则表达式将更有意义。有关更多信息，请参见php函数preg_match_all。

正则表达式是双刃剑。添加的复杂性越多，解决问题就越困难。这就是为什么有时很难找到可以匹配所有情况的正则表达式的原因，最好使用几个较小的正则表达式。拥有一个良好的问题可能会非常有帮助，并且可以让您开始思考角色范围，约束，断言，重复，可选值等。对组捕获的更多关注将使匹配对进一步处理有用。随意改善示例中的表情，让我们知道您的工作方式！

有用的资源

在下面，您可以找到更多信息和资源，以帮助您的正则技能发展。如果您发现未列出的有用的内容，请随时在文章中添加评论。

lea verou - /reg（exp）{2}LAIND/：神秘面纱的正则表达式 https://www.youtube.com/watch?v=eklues9rvak

> PHP库

>名称描述 Regexpbuilder 使用人类可读的方法创建正则 Noonoofluentregex 使用流利的设定器和以上类似的英语术语来构建正则表达式 Hoaregex 提供分析正则和生成字符串的工具正则反向给定正则表达式将生成一个字符串

>网站

url 描述 Regex101.com PCRE在线正则测试仪 regextester.com PCRE在线正则测试仪 rexv.org PCRE在线正则测试仪 debuggex.com 支持PCRE，并提供非常有用的视觉正则辩论式调试器 Regexper.com JavaScript样式的正则表达式，但可用于调试 phpliveregex.com Preg功能的在线测试仪 regxlib.com 准备使用的正则表达式数据库常规表达正则教程，书籍评论，示例

书籍

>标题描述作者 >编辑掌握正则表达式必须有正则书杰弗里·弗里德尔（Jeffrey Friedl） O’Reilly 正则表达式袖珍参考 Perl，Ruby，Php，Python，C，Java和.net的正则表达式托尼·乔布恩 O’Reilly

经常询问的问题（常见问题解答）有关正则表达式（REGEX）

>正则表达式（REGEX）的哪些实际应用？它们通常在数据验证中使用，以确保用户输入匹配特定格式，例如电子邮件地址或电话号码。它们也可以用于网络刮擦中，以从网页中提取特定的信息。此外，REGEX可以用于文本处理中的任务，例如查找和替换特定的文本字符串，将字符串分配到一个子字符串中等等。？

创建复杂的正则表达式涉及理解和组合各种正则表达式组件。这些包括文字，角色类别，量词和化角。通过以不同的方式组合这些组件，您可以创建符合各种图案的正则表达式。例如，您可以创建一个与电子邮件地址，电话号码或URL匹配的正则表达式。

使用正则表达式时，有什么常见错误需要避免哪些错误？ *），这可能导致意外的结果。另一个常见的错误是当要从字面上解释特殊角色时，没有正确地逃脱特殊字符。此外，重要的是要记住，默认情况下，正则表达式对大小写敏感，因此，如果您想忽略案例，则需要使用适当的标志。

>我如何测试我的正则表达式（REGEX）？ >

>有几种可用的在线工具可让您测试正则表达式。这些工具通常允许您输入正则表达式和测试字符串，然后突出显示与正则表达式匹配的测试字符串的各个部分。这可能是调试正则表达式并确保它们按预期工作的好方法。

可以在所有编程语言中使用正则表达式（REGEX）吗？表达某种形式。但是，在语言之间，所支持的特定语法和功能可能会有所不同。例如，JavaScript，Python和Ruby都支持正则表达式，但它们每个都有自己的独特语法和功能。

>使用正则表达式（REGEX）有什么含义？虽然正则表达式可能非常强大，但如果不正确使用，它们也可能是资源密集的。复杂的正则表达式可能需要很长时间才能执行，尤其是在大量文本上。因此，必须明智地使用正则表达式并尽可能地优化它们。

>如何优化我的正则表达式（REGEX）？

>有几种优化正则表达式的策略。其中包括避免使用不必要的量化符，当您不需要匹配的文本时使用非捕捉组，以及在可能的情况下使用字符类而不是交替。此外，某些正则表达引擎提供了优化功能，例如懒量化量，可以提高性能。

有哪些资源可以更多地了解正则表达式（REGEX）？可用于了解有关正则表达式的更多信息。其中包括在线教程，书籍和互动学习平台。此外，许多编程语言都有有关其正则表达语法和功能的大量文档。

>可以使用正则表达式（REGEX）来解析HTML或XML？

>在技术上可以使用正则表达式时要解析HTML或XML，通常不建议使用。这是因为HTML和XML具有嵌套的结构，该结构可能难以准确地捕获，以正则表达式。相反，通常最好使用专用的HTML或XML解析器。

>正则表达式（REGEX）有哪些替代方法？根据手头的任务，您最好使用其他方法。例如，对于简单的字符串操纵任务，您可以使用内置的字符串方法而不是正则表达式。对于解析HTML或XML，通常会使用专用解析器。对于复杂的文本处理任务，您可能需要考虑使用自然语言处理库。>

以上是用实际的例子揭开正面的神秘面纱的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

用实际的例子揭开正面的神秘面纱

钥匙要点

1。定义方案

字符类是否正确定义了特定域？

设想：

6至12个字符

匹配的URL

我们必须匹配每个重复 - 非连续性

有用的资源

lea verou - /reg（exp）{2}LAIND/：神秘面纱的正则表达式 https://www.youtube.com/watch?v=eklues9rvak

> PHP库

>网站

书籍

经常询问的问题（常见问题解答）有关正则表达式（REGEX）

有哪些资源可以更多地了解正则表达式（REGEX）？可用于了解有关正则表达式的更多信息。其中包括在线教程，书籍和互动学习平台。此外，许多编程语言都有有关其正则表达语法和功能的大量文档。

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题