如何在Python中使用正则表达式匹配多行块?

Susan Sarandon
发布: 2024-10-24 22:16:02
原创
742 人浏览过

How to Match Multiline Blocks in Python Using Regular Expressions?

使用正则表达式匹配多行块

使用 Python 的正则表达式匹配跨多行的文本时可能会遇到困难。考虑以下示例文本:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times).
登录后复制

目标是捕获两个组件:

  • “一些变化的文本”
  • 所有大写行位于两行下方它(不包括任何换行符)

已尝试多种方法但未成功:

<code class="python">re.compile(r"^>(\w+)$$(\n[.$]+)^$", re.MULTILINE) # Capture both parts
re.compile(r"([^>][\w\s]+)$", re.MULTILINE|re.DOTALL) # Just textlines</code>
登录后复制

要解决此问题,请使用以下正则表达式:

<code class="python">re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)</code>
登录后复制

请记住,锚点“^”和“$”不匹配换行符。因此,在多行模式下,“^”在换行符之后,“$”在换行符之前。

此外,请注意各种换行符格式。对于可能包含换行符、回车符或两者的文本,请使用以下更具包容性的正则表达式:

<code class="python">re.compile(r"^(.+)(?:\n|\r\n?)((?:(?:\n|\r\n?).+)+)", re.MULTILINE)</code>
登录后复制

此处不需要 DOTALL 修饰符,因为点已经排除了换行符。

以上是如何在Python中使用正则表达式匹配多行块?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!