首页 > web前端 > js教程 > 正则表达式的替代方案:APG-Exp

正则表达式的替代方案:APG-Exp

William Shakespeare
发布: 2025-02-17 11:25:18
原创
1097 人浏览过

An Alternative to Regular Expressions: apg-exp

本文经Sebastian Seitz和Almir Bijedic同行评审。感谢所有SitePoint的同行评审员,使SitePoint的内容达到最佳状态!

几乎每个程序员都会不时地需要以某种形式使用正则表达式。对许多人来说,模式语法看起来可能神秘而令人望而生畏。本教程将介绍一个新的模式匹配引擎apg-exp——一个功能丰富的RegExp替代方案,它使用ABNF模式语法,更容易阅读。

关键要点

  • apg-exp 为正则表达式提供了一种用户友好的替代方案,它使用 ABNF 语法,对于那些不熟悉传统 RegExp 模式的用户来说更容易阅读和理解。
  • apg-exp 的安装和使用非常简单,支持 Node.js 环境和 GitHub 的直接下载选项,使其可以访问各种项目设置。
  • apg-exp 使用的 ABNF 语法将复杂的模式分解为更简单、更易读的组件,这比通常神秘的正则表达式更直观。
  • apg-exp 支持 JavaScript 的 RegExp 中不可用的高级模式匹配功能,例如递归,这对于匹配嵌套模式至关重要。
  • 该库提供详细的错误处理和调试工具,帮助开发人员有效地识别和解决模式匹配逻辑中的问题。
  • 尽管功能强大,但 apg-exp 仍然保持简单的 API,使其易于集成和使用,无需对现有代码库进行大量修改。

快速比较

您是否曾经需要验证电子邮件地址并遇到类似这样的情况?

<code>^[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}$</code>
登录后复制
登录后复制

模式匹配引擎是这项工作的正确工具。这是一个设计良好、编写良好的正则表达式。它运行良好。那么还有什么不喜欢呢?

好吧,如果您是正则表达式的专家,那就什么也没有。但对于我们其他人来说,它们可能是

  • 难以阅读
  • 更难编写
  • 难以维护

正则表达式语法有着悠久而历史悠久的历史,并且已深深集成到我们作为程序员每天使用的许多工具和语言中。

但是,有一种替代语法已经存在了差不多同样长的时间,它在互联网技术规范的编写者和使用者中非常流行,它具有正则表达式的所有功能,但在 JavaScript 编程世界中很少使用。即增强巴科斯-诺尔范式(ABNF),由 IETF 在 RFC 5234 和 RFC 7405 中正式定义。

让我们看看同一个电子邮件地址在 ABNF 中是什么样的。

<code>email-address   = local "@" domain
local           = local-word *("." local-word)
domain          = 1*(sub-domain ".") top-domain
local-word      = 1*local-char
sub-domain      = 1*sub-domain-char
top-domain      = 2*6top-domain-char
local-char      = alpha / num / special
sub-domain-char = alpha / num / "-"
top-domain-char = alpha
alpha           = %d65-90 / %d97-122
num             = %d48-57
special         = %d33 / %d35 / %d36-39 / %d42-43 / %d45 / %d47 
                / %d61 / %d63 / %d94-96 / %d123-126</code>
登录后复制
登录后复制

当然,它并不紧凑,但与 HTML 和 XML 一样,它旨在被人类和机器阅读。我猜想,仅仅是略微了解通配符搜索模式,您几乎就可以用“简单的英语”阅读这里发生的事情。

  • 电子邮件地址定义为由 @ 分隔的本地部分和域
  • 本地部分是一个单词,后跟可选的点分隔的单词
  • 域是一个或多个点分隔的子域,后跟单个顶级域
  • 你这里可能不知道的唯一事情,但你可能猜到的是:
    • 正如通配符字符 表示“零个或多个”一样,1 表示“一个或多个”,而 2*6 表示最小 2 次和最大 6 次重复
    • / 分隔替代选择
    • %d 定义十进制字符代码和字符代码范围
    • 例如,�5 表示 #,ASCII 十进制 35
    • �5-90 表示 A-Z 范围内的任何字符,ASCII 十进制 65-90

示例 1 中比较了 RegExp 和 apg-exp 的此电子邮件地址。

apg-exp 是一个模式匹配引擎,旨在具有 RegExp 的外观和感觉,但使用 ABNF 语法进行模式定义。在接下来的几节中,我将引导您完成:

  • 如何将 apg-exp 集成到您的应用程序中
  • ABNF 语法的简短指南
  • 使用 apg-exp——一些示例
  • 下一步去哪里——更多细节,高级示例

启动并运行——如何获取它

npm

如果您在 Node.js 环境中工作,请从您的项目目录运行:

<code>^[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}$</code>
登录后复制
登录后复制

然后,您可以使用 require() 在代码中访问它。

例如:

<code>email-address   = local "@" domain
local           = local-word *("." local-word)
domain          = 1*(sub-domain ".") top-domain
local-word      = 1*local-char
sub-domain      = 1*sub-domain-char
top-domain      = 2*6top-domain-char
local-char      = alpha / num / special
sub-domain-char = alpha / num / "-"
top-domain-char = alpha
alpha           = %d65-90 / %d97-122
num             = %d48-57
special         = %d33 / %d35 / %d36-39 / %d42-43 / %d45 / %d47 
                / %d61 / %d63 / %d94-96 / %d123-126</code>
登录后复制
登录后复制

GitHub

要从 GitHub 获取代码副本,您可以将存储库克隆到您的项目目录:

<code>npm install apg-exp --save</code>
登录后复制

或将其下载为 zip 文件。

然后在 page.html 中:

<code>var ApgExp = require("apg-exp");
var exp = new ApgExp(pattern, flags);
var result = exp.exec(stringToMatch);</code>
登录后复制

CDN

您还可以使用 RawGit 直接从 GitHub 源代码创建 CDN 版本。但是,请务必阅读无正常运行时间或支持保证(实际上,请务必阅读整个常见问题解答)。

本教程中的所有示例都使用以下内容。

<code>git clone https://github.com/ldthomas/apg-js2-exp.git apg-exp</code>
登录后复制

这些文件缓存在 MaxCDN 服务器上,只要它们可用,您就可以随意使用它们进行测试。但是,对于生产环境,您应该将 apgexp-min.js 和 apgexp.css 的副本放置在您自己的服务器上,以确保访问,并根据您的应用程序的最佳方式将它们包含在您的页面中。

(以下内容因篇幅过长而被截断,请提供后续部分以便继续处理)

以上是正则表达式的替代方案:APG-Exp的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板