> 백엔드 개발 > PHP 튜토리얼 > php抓包有什么好的工具提取抓取的页面信息??

php抓包有什么好的工具提取抓取的页面信息??

WBOY
풀어 주다: 2016-06-06 20:26:30
원래의
1953명이 탐색했습니다.

php抓包有什么好的工具提取抓取的页面信息??

回复内容:

php抓包有什么好的工具提取抓取的页面信息??

http://simplehtmldom.sourceforge.net/manual.htm

<code><?php require dirname(__FILE__).'/simple_html_dom.php';
$html = file_get_html('http://php.net/');
$news = array();
foreach($html->find('article.newsentry') as $article) {
    $item['time']    = trim($article->find('time',            0)->plaintext);
    $item['title']   = trim($article->find('h2.newstitle',    0)->plaintext);
    $item['content'] = trim($article->find('div.newscontent', 0)->plaintext);
    $news[] = $item;
}
print_r($news);</code>
로그인 후 복사

file_get_html耗时只比wget和curl多一点.
simple_html_dom.php进行DOM分析速度也不慢,使用PHP7(PCRE JIT)速度还能成倍提升.
另外还有:
phpQuery - jQuery port to PHP
https://github.com/TobiaszCudnik/phpquery
http://querylist.cc/

Ganon - Fast (HTML DOM) parser written in PHP
https://github.com/Shemahmforash/Ganon

PHP抓包?没懂...
推荐个抓包的Fiddler

浏览器本身自带,如果想抓机器流量找。死耐fao。 音译,名字忘记了,或者百度搜索 科来

你是要采集?截取?还是存储数据流

根据你问题下的评论:

之前表达有误,我想问的是php抓取页面后,有什么好的方式解析dom提取数据?

可以看下这个开源项目
https://github.com/sunra/php-simple-html-dom-parser

jQueryPHP snoopy

관련 라벨:
php
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿