> 백엔드 개발 > PHP 튜토리얼 > 구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?

구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?

DDD
풀어 주다: 2024-12-28 19:40:11
원래의
790명이 탐색했습니다.

How Can I Extract the Source URL of the First Image from an HTML Document Using Parsing Techniques?

파싱 기술을 사용하여 HTML 이미지 태그의 소스 URL 검색

내에서 처음으로 나타나는 이미지 태그의 소스 URL과 같은 동적 콘텐츠 검색 HTML 문서는 웹 개발의 일반적인 작업입니다. 이를 달성하기 위해 DOMDocument 및 DOMXpath와 같은 HTML 구문 분석 기술이 사용됩니다.

DOMDocument 및 DOMXpath

DOMDocument는 HTML 문서를 트리 구조로 나타내어 해당 문서에 대한 액세스를 가능하게 합니다. 요소와 속성. DOMXpath는 이 트리를 탐색하고 특정 값을 추출하는 효율적인 방법을 제공합니다.

DOMDocument 및 DOMXpath를 사용한 솔루션

  • HTML 문서를 DOMDocument 개체에 로드합니다.
  • 다음과 연결된 DOMXPath 개체를 만듭니다. DOMDocument.
  • XPath 표현식을 사용하여 첫 번째 이미지 태그(//img/@src)의 소스 URL을 검색합니다.
  • 검색된 URL을 변수.

$html = '<img border="0" src="/images/image.jpg" alt="Image" width="100" height="100" />';

$doc = new DOMDocument();
$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$src = $xpath->evaluate("string(//img/@src)");
로그인 후 복사

첫 번째 이미지 소스 검색

소스만 확인하려면 첫 번째 이미지의 URL을 얻으려면 string(//img/@src) XPath 표현식을 사용하세요. 이 표현식은 소스 URL을 문자열로 반환합니다.

One-Liner Solution

보다 간결한 솔루션을 위해 다음 one-liner를 사용할 수 있습니다.

$src = (string) reset(simplexml_import_dom(DOMDocument::loadHTML($html))->xpath("//img/@src"));
로그인 후 복사

위 내용은 구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿