share一段采集程序的代码
Freigeben: 2016-07-25 09:11:20
Original
937 Leute haben es durchsucht
看到总有人问curl的问题,这两天没事写了个采集论坛的小程序。里面包括了模拟登陆,获取页面源代码,正则匹配结果等部分,希望对大家有用。
-
set_time_limit(0);
-
- //cookie保存目录
- $cookie_jar = '/tmp/cookie.tmp';
-
- /*函数------------------------------------------------------------------------------------------------------------*/
-
- //模拟请求数据
- function request($url,$postfields,$cookie_jar,$referer){
- $ch = curl_init();
- $options = array(CURLOPT_URL => $url,
- CURLOPT_HEADER => 0,
- CURLOPT_NOBODY => 0,
- CURLOPT_PORT => 80,
- CURLOPT_POST => 1,
- CURLOPT_POSTFIELDS => $postfields,
- CURLOPT_RETURNTRANSFER => 1,
- CURLOPT_FOLLOWLOCATION => 1,
- CURLOPT_COOKIEJAR => $cookie_jar,
- CURLOPT_COOKIEFILE => $cookie_jar,
- CURLOPT_REFERER => $referer
- );
- curl_setopt_array($ch, $options);
- $code = curl_exec($ch);
- curl_close($ch);
- return $code;
- }
-
- //获取帖子列表
- function getThreadsList($code){
- preg_match_all('/
|
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31