使用 DOTALL 正则表达式修饰符匹配换行符
使用包含普通字符、空格和包含在 HTML div 标签中的换行符的字符串时,目标是提取
要解决此问题,必须使用 DOTALL 修饰符 (/s)。此修饰符确保点字符(正则表达式中的 .)匹配所有字符,包括换行符。通过将此修饰符合并到正则表达式中,可以准确捕获 div 标签内的内容:
'/<div>(.*)<\/div>/s'
但是,这种方法可能会导致贪婪匹配。为了解决这个问题,建议使用非贪婪匹配:
'/<div>(.*?)<\/div>/s'
或者,匹配除
'/<div>([^<]*)<\/div>/'
之外的所有内容。如果没有其他标签,也可以是一个解决方案:
'#<div>([^<]*)</div>#'
值得注意的是,使用 / 之外的字符作为正则表达式分隔符可以增强可读性,无需在 中转义 /分区>。下面是一个使用 # 作为分隔符的示例:
虽然这些解决方案可能足以满足简单的情况,但必须承认 HTML 很复杂,仅靠正则表达式解析可能还不够。为了确保解析全面可靠,建议考虑使用专用的 HTML 解析器。以上是从 HTML 标签中提取内容时如何匹配正则表达式中的换行符?的详细内容。更多信息请关注PHP中文网其他相关文章!