Maison > développement back-end > tutoriel php > php抓取这个页面的内容,该如何解决

php抓取这个页面的内容,该如何解决

WBOY
Libérer: 2016-06-13 12:04:46
original
852 Les gens l'ont consulté

php抓取这个页面的内容

需要抓取的部分已经用红线标出来,
只需要抓取第一页的就可以,
抓取页面:http://www.mafengwo.cn/yj/10206/2-0-1.html
一以前都是用这个类simple_html_dom.php,但是这个我用这个类抓取不出来了
------解决方案--------------------
可以用正則提取。
------解决方案--------------------
不至于吧?

include 'simple_html_dom.php';<br />$opts = array( <br />  'http'=>array( <br />    'user_agent' => $_SERVER['HTTP_USER_AGENT']<br />  ) <br />); <br />$context = stream_context_create($opts); <br />$url = 'http://www.mafengwo.cn/yj/10206/2-0-1.html';<br /> <br />$html = file_get_html($url, false, $context);<br />$div = $html->find('div.post-list ul');<br />foreach($div[0]->find('li') as $i=>$item) {<br />  echo $item->find('img')[0]->src, PHP_EOL;<br />  echo trim($item->find('h2')[0]->text()), PHP_EOL;<br />  echo trim($item->find('div')[3]->text()), PHP_EOL;<br />  //echo '**', $item->innertext(), PHP_EOL;<br />}
Copier après la connexion

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal