> 백엔드 개발 > C++ > 정규식을 사용하여 태그에서 href 값을 추출하는 방법은 무엇입니까?

정규식을 사용하여 태그에서 href 값을 추출하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2025-01-10 06:19:40
원래의
702명이 탐색했습니다.

How to Extract href Values from  Tags Using Regular Expressions?

정규 표현식을 사용하여 <a> 링크의 'href' 값 찾기

HTML에서 링크를 추출하는 것은 일반적으로 "(?>.?)"와 같은 간단한 패턴을 사용하여 수행할 수 있습니다. 그러나 이 방법은 'href' 속성을 구체적으로 얻으려고 할 때 부족합니다.

이 문제를 해결하려면 보다 정확한 정규식을 사용하여 <a> 태그 내에서 'href' 값을 찾을 수 있습니다. 유효한 패턴은 다음과 같습니다.

<code><a\s+(?:[^>]*?\s+)?href=(["'])(.*?)</code>
로그인 후 복사

이 정규식은 다음과 같이 작동합니다.

  • 시작 <a> 태그를 찾으세요.
  • Optional은 'href' 속성 앞의 모든 속성이나 공백과 일치합니다.
  • 시작 인용문(단일 또는 이중)을 캡처합니다.
  • 따옴표 사이의 모든 문자를 일치시키고 이를 그룹으로 캡처합니다(링크된 URL 포함).
  • 닫는 인용문이 시작 인용문과 일치하는지 확인하세요.

이 정규식을 사용하면 다음과 같은 링크에서 'href' 값을 추출할 수 있습니다.

<code><a ....="" href="https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a>
<a ....="" href="http://https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a>
<a ....="" href="https://https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a></code>
로그인 후 복사

그러나 이 정규식은 필수 "?" 및 "=" 문자가 포함되지 않은 링크와도 일치한다는 점에 유의하는 것이 중요합니다. 이것이 문제가 되는 경우 추가 필터링이 필요할 수 있습니다.

위 내용은 정규식을 사용하여 태그에서 href 값을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿