백엔드 개발 PHP 튜토리얼 PHP는 지정된 URL 페이지의 모든 링크를 가져옵니다.

PHP는 지정된 URL 페이지의 모든 링크를 가져옵니다.

Aug 08, 2016 am 09:25 AM
href html nbsp url

양식:http://www.uphtm.com/php/253.html

이것은 실제로 우리 개발자들이 흔히 사용하는 것입니다. 다른 웹사이트에서 친숙한 링크를 캡처하는 프로젝트를 할 때 사용했습니다. 오늘 친구가 지정된 URL 페이지의 모든 링크 기능을 가져오기 위해 PHP 함수를 컴파일하는 것을 보았습니다. . 정리했습니다. 일어나서 살펴보세요.

다음 코드는 지정된 URL 페이지의 모든 링크, 즉 모든 태그의 href 속성을 얻을 수 있습니다.

  1. // 링크의 HTML 코드 가져오기
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = 새 DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = 새 DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i < $hrefs->length; $i++) {
  8. $href = $hrefs->항목($i);
  9. $url = $href->getAttribute('href');
  10. echo $url.'
    ';
  11. }

이 코드는 모든 태그의 href 속성을 가져오지만 href 속성 값이 반드시 링크일 필요는 없습니다. 이를 필터링하고 http:

로 시작하는 링크 주소만 유지할 수 있습니다.
  1. // 링크의 HTML 코드 가져오기
  2. $html = file_get_contents('http://www.111cn.net');
  3. $dom = 새 DOMDocument();
  4. @$dom->loadHTML($html);
  5. $xpath = 새 DOMXPath($dom);
  6. $hrefs = $xpath->evaluate('/html/body//a');
  7. for ($i = 0; $i < $hrefs->length; $i++) {
  8. $href = $hrefs->항목($i);
  9. $url = $href->getAttribute('href');
  10. // http로 시작하는 링크 유지
  11. if(substr($url, 0, 4) == 'http')
  12. echo $url.'
    ';
  13. }

fopen() 함수는 지정된 웹페이지의 모든 링크를 읽고 개수를 계산합니다. 이 코드는 웹페이지의 내용을 수집해야 하는 일부 장소에서 사용하기에 적합합니다. 홈 페이지는 Baidu 홈 페이지의 링크를 찾기 위한 예로 사용됩니다. 모든 링크 주소와 코드는 테스트되었으며 완벽하게 사용할 수 있습니다.

  1. if(empty($url))$url = "http://www.baidu.com/";//링크를 수집해야 하는 URL 주소
  2. $site=substr($url,0,strpos($url,"/",8));
  3. $base=substr($url,0,strrpos($url,"/")+1);//파일이 위치한 디렉토리
  4. $fp = fopen($url, "r" );//URL 주소 페이지 열기
  5. while(!feof($fp))$contents.=fread($fp,1024);
  6. $pattern="|href=['"]?([^ '"]+)['" ]|U";
  7. preg_match_all($pattern,$contents, $regArr, PREG_SET_ORDER);//정규 표현식을 사용하여 모든 href와 일치=
  8. for($i=0;$i
  9. if(!eregi("://",$regArr[$i][1]))//상대 경로인지, 즉 아직 //가 있는지 확인
  10. if(substr($regArr[$i][1],0,1)=="/")//사이트의 루트 디렉터리인가요
  11. echo "link".($i+1).":".$site.$regArr[$i][1]."
    ";//루트 디렉터리
  12. 그밖에
  13. echo "link".($i+1).":".$base.$regArr[$i][1]."
    ";//현재 디렉터리
  14. 그밖에
  15. echo "link".($i+1).":".$regArr[$i][1]."
    ";//상대 경로
  16. }
  17. fclose($fp);
  18. ?>

양식:http://www.uphtm.com/php/253.html

위 내용은 PHP 튜토리얼에 관심이 있는 친구들에게 내용을 포함하여 지정된 URL 페이지의 모든 링크를 가져오는 방법을 소개합니다.

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

HTML의 테이블 테두리 HTML의 테이블 테두리 Sep 04, 2024 pm 04:49 PM

HTML의 테이블 테두리 안내. 여기에서는 HTML의 테이블 테두리 예제를 사용하여 테이블 테두리를 정의하는 여러 가지 방법을 논의합니다.

HTML 여백-왼쪽 HTML 여백-왼쪽 Sep 04, 2024 pm 04:48 PM

HTML 여백-왼쪽 안내. 여기에서는 HTML margin-left에 대한 간략한 개요와 코드 구현과 함께 예제를 논의합니다.

HTML의 중첩 테이블 HTML의 중첩 테이블 Sep 04, 2024 pm 04:49 PM

HTML의 Nested Table에 대한 안내입니다. 여기에서는 각 예와 함께 테이블 내에 테이블을 만드는 방법을 설명합니다.

HTML 테이블 레이아웃 HTML 테이블 레이아웃 Sep 04, 2024 pm 04:54 PM

HTML 테이블 레이아웃 안내. 여기에서는 HTML 테이블 레이아웃의 값에 대해 예제 및 출력 n 세부 사항과 함께 논의합니다.

HTML 입력 자리 표시자 HTML 입력 자리 표시자 Sep 04, 2024 pm 04:54 PM

HTML 입력 자리 표시자 안내. 여기서는 코드 및 출력과 함께 HTML 입력 자리 표시자의 예를 논의합니다.

HTML 정렬 목록 HTML 정렬 목록 Sep 04, 2024 pm 04:43 PM

HTML 순서 목록에 대한 안내입니다. 여기서는 HTML Ordered 목록 및 유형에 대한 소개와 각각의 예에 대해서도 설명합니다.

HTML에서 텍스트 이동 HTML에서 텍스트 이동 Sep 04, 2024 pm 04:45 PM

HTML에서 텍스트 이동 안내. 여기서는 Marquee 태그가 구문과 함께 작동하는 방식과 구현할 예제에 대해 소개합니다.

HTML 온클릭 버튼 HTML 온클릭 버튼 Sep 04, 2024 pm 04:49 PM

HTML onclick 버튼에 대한 안내입니다. 여기에서는 각각의 소개, 작업, 예제 및 다양한 이벤트의 onclick 이벤트에 대해 설명합니다.

See all articles