如何使用正则表达式提取日志中两个字符串之间的匹配项?

Mary-Kate Olsen
发布: 2024-10-23 22:17:02
原创
824 人浏览过

How to Extract Matches Between Two Strings in Logs with a Regex?

用于提取两个字符串之间的匹配的正则表达式

给定一个包含由特定开始和结束标记括起来的多行字符串的大型日志文件,目标是仅提取并打印最短的此类字符串。但是,开始标记在文件中的其他位置使用,因此简单的正则表达式是不够的。

为了解决这个问题,我们可以使用以下正则表达式:

(start((?!start).)*?end)
登录后复制

此正则表达式匹配字符串:

  • 以“start”开头,后跟不包含“start”的字符。
  • 以“end”结尾。

使用Python 的 re.findall 方法带有单行修饰符(re.S),我们可以从输入文件中检索所有此类字符串:

<code class="python">import re

text = """
start spam
start rubbish
start wait for it...
    profit!
here end
start garbage
start second match
win. end
"""

matches = re.findall('(start((?!start).)*?end)', text, re.S)
print(matches)</code>
登录后复制

这将输出所需的结果:

['start wait for it...
    profit!
here end', 'start second match
win. end']
登录后复制

以上是如何使用正则表达式提取日志中两个字符串之间的匹配项?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!