HTML 구문 분석을 위해 정규식에서 선택적 공백을 무시하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-10-24 08:29:01
원래의
639명이 탐색했습니다.

How to Ignore Optional Whitespace in Regular Expressions for HTML Parsing?

정규 표현식의 선택적 공백

HTML이나 텍스트 데이터를 구문 분석할 때 특정 문자 사이의 공백을 무시해야 하는 경우가 많습니다. 그러나 정규 표현식을 사용하면 어려울 수 있습니다.

해결 방법 s? 및 s* 수량자

문자 사이의 선택적 공백을 일치시키려면 수량자 s? 및 s*.

  • s는 모든 공백 문자(공백, 탭, 줄바꿈 등)와 일치합니다.
  • ?는 다음을 의미합니다. 선행 문자는 한 번 나타날 수도 있고 전혀 발생하지 않을 수도 있습니다.
  • *는 선행 문자가 0번 이상 나타날 수 있음을 의미합니다.

다음 HTML 태그에서 공백을 무시하려면:

<code class="html"><a href="/wiki/File:Sky1.png" title="File:Sky1.png">
<img alt="Sky1.png" src="http://media-mcw.cursecdn.com/thumb/5/56/Sky1.png/150px-Sky1.png" width="150" height="84">
</a></code>
로그인 후 복사

다음 정규식을 사용합니다.

'#<a href\s?="(.*?)" title\s?="(.*?)"><img alt\s?="(.*?)" src\s?="(.*?)"[\s*]width\s?="150"[\s*]height\s?="(.*?)"></a>#'
로그인 후 복사

이 표현식은 속성 이름과 속성 사이에 선택적 공백을 허용합니다. 해당 값은 물론 속성 값과 주변 HTML 태그 사이에도 적용됩니다.

문자 클래스에 대한 참고 사항

원래 코드에서는 문자 클래스 [s를 사용했습니다. ]로 인해 예상치 못한 결과가 발생했습니다. 문자 클래스는 해당 멤버 중 하나와 한 번 일치하며 수량자는 여러 번 발생할 수 있도록 허용합니다. [s]를 s로 바꾸면 공백 문자만 일치하고 한정자가 해당 문자에만 적용되도록 할 수 있습니다.

위 내용은 HTML 구문 분석을 위해 정규식에서 선택적 공백을 무시하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!