share一段采集程序的代码

WBOY
Libérer: 2016-07-25 09:11:20
original
902 Les gens l'ont consulté
看到总有人问curl的问题,这两天没事写了个采集论坛的小程序。里面包括了模拟登陆,获取页面源代码,正则匹配结果等部分,希望对大家有用。
  1. set_time_limit(0);
  2. //cookie保存目录
  3. $cookie_jar = '/tmp/cookie.tmp';
  4. /*函数------------------------------------------------------------------------------------------------------------*/
  5. //模拟请求数据
  6. function request($url,$postfields,$cookie_jar,$referer){
  7. $ch = curl_init();
  8. $options = array(CURLOPT_URL => $url,
  9. CURLOPT_HEADER => 0,
  10. CURLOPT_NOBODY => 0,
  11. CURLOPT_PORT => 80,
  12. CURLOPT_POST => 1,
  13. CURLOPT_POSTFIELDS => $postfields,
  14. CURLOPT_RETURNTRANSFER => 1,
  15. CURLOPT_FOLLOWLOCATION => 1,
  16. CURLOPT_COOKIEJAR => $cookie_jar,
  17. CURLOPT_COOKIEFILE => $cookie_jar,
  18. CURLOPT_REFERER => $referer
  19. );
  20. curl_setopt_array($ch, $options);
  21. $code = curl_exec($ch);
  22. curl_close($ch);
  23. return $code;
  24. }
  25. //获取帖子列表
  26. function getThreadsList($code){
  27. preg_match_all('/
Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!