PHP는 어떻게 QueryList를 사용하여 동적으로 렌더링된 js 페이지를 쉽게 수집합니까?
이 장에서는 PHP가 QueryList를 사용하여 js 동적 렌더링 페이지를 쉽게 수집하는 방법을 소개합니다. 이는 특정 참조 가치가 있으므로 도움이 될 수 있습니다.
QueryList는 수집을 위해 jQuery를 사용하며 풍부한 플러그인을 가지고 있습니다. QueryList가 PhantomJS 플러그인을 사용하여 JS에서 동적으로 생성된 페이지 콘텐츠를 캡처하는 것을 보여드리겠습니다.
1. 설치
Composer를 사용하여 설치:
1. QueryList 설치
composer require jaeger/querylist
GitHub: https://github.com/jae-jae/QueryList
2. in
composer require jaeger/querylist-phantomjs
GitHub: https://github.com/jae-jae/QueryList-PhantomJS
2 PhantomJS 바이너리 파일을 다운로드하세요
PhantomJS 공식 웹사이트: http://phantomjs.org , 해당 플랫폼 PhantomJS 바이너리를 다운로드하세요.
3. 플러그인 API
QueryList 브라우저($url,$debug = false,$commandOpt = []): 브라우저를 사용하여 연결을 엽니다
4. "Today"를 수집하려면 "Today's Toutiao"의 모바일 버전을 예로 들어 보겠습니다. "Today's Toutiao"의 모바일 버전은 React 프레임워크를 기반으로 하며 콘텐츠는 순전히 동적으로 렌더링됩니다. 다음은 QueryList의 PhantomJs 플러그인 사용법을 보여줍니다.
1. 플러그인 설치
use QL\QueryList; use QL\Ext\PhantomJs; $ql = QueryList::getInstance(); // 安装时需要设置PhantomJS二进制文件路径 $ql->use(PhantomJs::class,'/usr/local/bin/phantomjs'); //or Custom function name $ql->use(PhantomJs::class,'/usr/local/bin/phantomjs','browser');
2.Example-1
동적으로 렌더링된 HTML 가져오기:
$html = $ql->browser('https://m.toutiao.com')->getHtml(); print_r($html);
모든 p 태그 텍스트 콘텐츠 가져오기:
$data = $ql->browser('https://m.toutiao.com')->find('p')->texts(); print_r($data->all());
출력:
Array( [0] => 自拍模式开启!国庆假期我和国旗合个影 [1] => 你旅途已开始 他们仍在自己的岗位上为你的假期保驾护航 [2] => 喜极而泣,都教授终于回到地球了! //....)
http 프록시 사용:
// 更多选项可以查看文档: http://phantomjs.org/api/command-line.html $ql->browser('https://m.toutiao.com',true,[ // 使用http代理 '--proxy' => '192.168.1.42:8080', '--proxy-type' => 'http' ])
3.Example-2
복잡한 요청 사용자 정의:
$data = $ql->browser(function (\JonnyW\PhantomJs\Http\RequestInterface $r){ $r->setMethod('GET'); $r->setUrl('https://m.toutiao.com'); $r->setTimeout(10000); // 10 seconds $r->setDelay(3); // 3 seconds return $r; })->find('p')->texts(); print_r($data->all());
디버그 모드 활성화 및 로컬에서 쿠키 파일 로드:
$data = $ql->browser(function (\JonnyW\PhantomJs\Http\RequestInterface $r){ $r->setMethod('GET'); $r->setUrl('https://m.toutiao.com'); $r->setTimeout(10000); // 10 seconds $r->setDelay(3); // 3 seconds return $r; },true,[ '--cookies-file' => '/path/to/cookies.txt' ])->rules([ 'title' => ['p','text'], 'link' => ['a','href'] ])->query()->getData(); print_r($data->all());
위 내용은 PHP는 어떻게 QueryList를 사용하여 동적으로 렌더링된 js 페이지를 쉽게 수집합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP 8.4는 상당한 양의 기능 중단 및 제거를 통해 몇 가지 새로운 기능, 보안 개선 및 성능 개선을 제공합니다. 이 가이드에서는 Ubuntu, Debian 또는 해당 파생 제품에서 PHP 8.4를 설치하거나 PHP 8.4로 업그레이드하는 방법을 설명합니다.

CakePHP는 PHP용 오픈 소스 프레임워크입니다. 이는 애플리케이션을 훨씬 쉽게 개발, 배포 및 유지 관리할 수 있도록 하기 위한 것입니다. CakePHP는 강력하고 이해하기 쉬운 MVC와 유사한 아키텍처를 기반으로 합니다. 모델, 뷰 및 컨트롤러 gu

VS Code라고도 알려진 Visual Studio Code는 모든 주요 운영 체제에서 사용할 수 있는 무료 소스 코드 편집기 또는 통합 개발 환경(IDE)입니다. 다양한 프로그래밍 언어에 대한 대규모 확장 모음을 통해 VS Code는

CakePHP는 오픈 소스 MVC 프레임워크입니다. 이를 통해 애플리케이션 개발, 배포 및 유지 관리가 훨씬 쉬워집니다. CakePHP에는 가장 일반적인 작업의 과부하를 줄이기 위한 여러 라이브러리가 있습니다.

이 튜토리얼은 PHP를 사용하여 XML 문서를 효율적으로 처리하는 방법을 보여줍니다. XML (Extensible Markup Language)은 인간의 가독성과 기계 구문 분석을 위해 설계된 다목적 텍스트 기반 마크 업 언어입니다. 일반적으로 데이터 저장 AN에 사용됩니다
