구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?-PHP 튜토리얼-php.cn

구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?

DDD

풀어 주다： 2024-12-28 19:40:11

원래의

904명이 탐색했습니다.

How Can I Extract the Source URL of the First Image from an HTML Document Using Parsing Techniques?

파싱 기술을 사용하여 HTML 이미지 태그의 소스 URL 검색

내에서 처음으로 나타나는 이미지 태그의 소스 URL과 같은 동적 콘텐츠 검색 HTML 문서는 웹 개발의 일반적인 작업입니다. 이를 달성하기 위해 DOMDocument 및 DOMXpath와 같은 HTML 구문 분석 기술이 사용됩니다.

DOMDocument 및 DOMXpath

DOMDocument는 HTML 문서를 트리 구조로 나타내어 해당 문서에 대한 액세스를 가능하게 합니다. 요소와 속성. DOMXpath는 이 트리를 탐색하고 특정 값을 추출하는 효율적인 방법을 제공합니다.

DOMDocument 및 DOMXpath를 사용한 솔루션

HTML 문서를 DOMDocument 개체에 로드합니다.
다음과 연결된 DOMXPath 개체를 만듭니다. DOMDocument.
XPath 표현식을 사용하여 첫 번째 이미지 태그(//img/@src)의 소스 URL을 검색합니다.
검색된 URL을 변수.

예

$html = '<img border="0" src="/images/image.jpg" alt="Image" width="100" height="100" />';

$doc = new DOMDocument();
$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$src = $xpath->evaluate("string(//img/@src)");

로그인 후 복사

첫 번째 이미지 소스 검색

소스만 확인하려면 첫 번째 이미지의 URL을 얻으려면 string(//img/@src) XPath 표현식을 사용하세요. 이 표현식은 소스 URL을 문자열로 반환합니다.

One-Liner Solution

보다 간결한 솔루션을 위해 다음 one-liner를 사용할 수 있습니다.

$src = (string) reset(simplexml_import_dom(DOMDocument::loadHTML($html))->xpath("//img/@src"));

로그인 후 복사

위 내용은 구문 분석 기술을 사용하여 HTML 문서에서 첫 번째 이미지의 소스 URL을 어떻게 추출할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!