특정 콘텐츠 타겟팅을 위한 DOMDocument 구문 분석
강력한 PHP 라이브러리인 "DOMDocument"를 사용하면 HTML 문서를 정확하게 구문 분석할 수 있습니다. 특정 이름을 가진 모든 태그를 검색하는 "getElementsByTagName"과 달리 이 방법은 XPath 쿼리를 활용하여 원하는 요소를 효과적으로 타겟팅합니다.
특정 컨텍스트 내의 텍스트 노드 캡처
To 특정 텍스트 콘텐츠를 추출하는 과정은 다음과 같습니다.
$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');
이 쿼리는 모든
"foreach" 루프를 사용하여 결과 요소 목록을 반복하면 실제 텍스트가 포함된 "nodeValue"를 추출할 수 있습니다.
foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }
구현 예
다음 HTML 조각을 고려하세요.
<code class="html"><div class="main"> <div class="text"> Capture this text 1 </div> </div> <div class="main"> <div class="text"> Capture this text 2 </div> </div></code>
제공된 쿼리를 사용하면 출력은 다음과 같습니다.
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
이것은 "DOMDocument" 및 XPath를 사용하여 계층적 HTML 구조 내에서 특정 텍스트 콘텐츠를 정확하게 추출하는 기능을 보여줍니다.
위 내용은 HTML에서 특정 텍스트 콘텐츠를 대상으로 지정하고 추출하기 위해 DOMDocument 및 XPath를 어떻게 사용할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!