Rumah pembangunan bahagian belakang tutorial php php curl采集站外内容示例代码

php curl采集站外内容示例代码

Jul 25, 2016 am 08:54 AM

  1. // 初始化一个 cURL 对象
  2. $curl = curl_init();
  3. // 设置你需要抓取的URL
  4. curl_setopt($curl, CURLOPT_URL, 'http://bbs.it-home.org');
  5. // 设置header
  6. curl_setopt($curl, CURLOPT_HEADER, 1);
  7. // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。
  8. curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
  9. // 运行cURL,请求网页
  10. $data = curl_exec($curl);
  11. // 关闭URL请求
  12. curl_close($curl);
复制代码

3、通过正则匹配找到关键数据

  1. //$data是curl_exec返回的的值,即采集的目标内容
  2. preg_match_all("/
  3. (.*?)/",$data, $out, PREG_SET_ORDER);
  4. foreach($out as $key => $value){
  5. //此处$value是数组,同时记录找到带匹配字符的整句和单独匹配的字符
  6. echo '匹配到的整句:'.$value[0].'
  7. ';
  8. echo '单独匹配到的:'.$value[1].'
  9. ';
  10. }
复制代码

PHP curl的技巧 1、超时的相关设置 通过curl_setopt($ch, opt) 可以设置一些超时的设置,主要包括: CURLOPT_TIMEOUT 设置cURL允许执行的最长秒数。 CURLOPT_TIMEOUT_MS 设置cURL允许执行的最长毫秒数。 (在cURL 7.16.2中被加入。从PHP 5.2.3起可使用。 ) CURLOPT_CONNECTTIMEOUT 在发起连接前等待的时间,如果设置为0,则无限等待。 CURLOPT_CONNECTTIMEOUT_MS 尝试连接等待的时间,以毫秒为单位。如果设置为0,则无限等待。 在cURL 7.16.2中被加入。从PHP 5.2.3开始可用。 CURLOPT_DNS_CACHE_TIMEOUT 设置在内存中保存DNS信息的时间,默认为120秒。

2、通过post提交数据,保留cookie

  1. //Curl 模拟登录 discuz 程序,适合DZ7.0

  2. !extension_loaded('curl') && die('The curl extension is not loaded.');

  3. $discuz_url = 'http://bbs.it-home.org';//论坛地址

  4. $login_url = $discuz_url .'/logging.php?action=login';//登录页地址
  5. $get_url = $discuz_url .'/my.php?item=threads'; //我的帖子
  6. $post_fields = array();

  7. //以下两项不需要修改
  8. $post_fields['loginfield'] = 'username';
  9. $post_fields['loginsubmit'] = 'true';
  10. //用户名和密码,必须填写
  11. $post_fields['username'] = 'jbxue';
  12. $post_fields['password'] = '88888888';
  13. //安全提问
  14. $post_fields['questionid'] = 0;
  15. $post_fields['answer'] = '';
  16. //@todo验证码
  17. $post_fields['seccodeverify'] = '';
  18. //获取表单FORMHASH

  19. $ch = curl_init($login_url);
  20. curl_setopt($ch, CURLOPT_HEADER, 0);
  21. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  22. $contents = curl_exec($ch);
  23. curl_close($ch);
  24. preg_match('//i', $contents, $matches);
  25. if(!empty($matches)) {
  26. $formhash = $matches[1];
  27. } else {
  28. die('Not found the forumhash.');
  29. }
  30. //POST数据,获取COOKIE

  31. $cookie_file = dirname(__FILE__) . '/cookie.txt';
  32. //$cookie_file = tempnam('/tmp');
  33. $ch = curl_init($login_url);
  34. curl_setopt($ch, CURLOPT_HEADER, 0);
  35. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  36. curl_setopt($ch, CURLOPT_POST, 1);
  37. curl_setopt($ch, CURLOPT_POSTFIELDS, $post_fields);
  38. curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
  39. curl_exec($ch);
  40. curl_close($ch);
  41. //带着上面得到的COOKIE获取需要登录后才能查看的页面内容

  42. $ch = curl_init($get_url);
  43. curl_setopt($ch, CURLOPT_HEADER, 0);
  44. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);
  45. curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
  46. $contents = curl_exec($ch);
  47. curl_close($ch);
  48. var_dump($contents);

复制代码


Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bekerja dengan Data Sesi Flash di Laravel Bekerja dengan Data Sesi Flash di Laravel Mar 12, 2025 pm 05:08 PM

Laravel memudahkan mengendalikan data sesi sementara menggunakan kaedah flash intuitifnya. Ini sesuai untuk memaparkan mesej ringkas, makluman, atau pemberitahuan dalam permohonan anda. Data hanya berterusan untuk permintaan seterusnya secara lalai: $ permintaan-

Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Mar 14, 2025 am 11:42 AM

Pelanjutan URL Pelanggan PHP (CURL) adalah alat yang berkuasa untuk pemaju, membolehkan interaksi lancar dengan pelayan jauh dan API rehat. Dengan memanfaatkan libcurl, perpustakaan pemindahan fail multi-protokol yang dihormati, php curl memudahkan execu yang cekap

Respons HTTP yang dipermudahkan dalam ujian Laravel Respons HTTP yang dipermudahkan dalam ujian Laravel Mar 12, 2025 pm 05:09 PM

Laravel menyediakan sintaks simulasi respons HTTP ringkas, memudahkan ujian interaksi HTTP. Pendekatan ini dengan ketara mengurangkan redundansi kod semasa membuat simulasi ujian anda lebih intuitif. Pelaksanaan asas menyediakan pelbagai jenis pintasan jenis tindak balas: Gunakan Illuminate \ Support \ Facades \ http; Http :: palsu ([ 'Google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>

12 skrip sembang php terbaik di codecanyon 12 skrip sembang php terbaik di codecanyon Mar 13, 2025 pm 12:08 PM

Adakah anda ingin memberikan penyelesaian segera, segera kepada masalah yang paling mendesak pelanggan anda? Sembang langsung membolehkan anda mempunyai perbualan masa nyata dengan pelanggan dan menyelesaikan masalah mereka dengan serta-merta. Ia membolehkan anda memberikan perkhidmatan yang lebih pantas kepada adat anda

Terangkan konsep pengikatan statik lewat dalam PHP. Terangkan konsep pengikatan statik lewat dalam PHP. Mar 21, 2025 pm 01:33 PM

Artikel membincangkan pengikatan statik lewat (LSB) dalam PHP, yang diperkenalkan dalam Php 5.3, yang membolehkan resolusi runtime kaedah statik memerlukan lebih banyak warisan yang fleksibel. Isu: LSB vs polimorfisme tradisional; Aplikasi Praktikal LSB dan Potensi Perfo

Ciri -ciri Keselamatan Rangka Kerja: Melindungi Kelemahan. Ciri -ciri Keselamatan Rangka Kerja: Melindungi Kelemahan. Mar 28, 2025 pm 05:11 PM

Artikel membincangkan ciri -ciri keselamatan penting dalam rangka kerja untuk melindungi daripada kelemahan, termasuk pengesahan input, pengesahan, dan kemas kini tetap.

Menyesuaikan/Memperluas Rangka Kerja: Cara Menambah Fungsi Custom. Menyesuaikan/Memperluas Rangka Kerja: Cara Menambah Fungsi Custom. Mar 28, 2025 pm 05:12 PM

Artikel ini membincangkan menambah fungsi khusus kepada kerangka kerja, memberi tumpuan kepada pemahaman seni bina, mengenal pasti titik lanjutan, dan amalan terbaik untuk integrasi dan debugging.

See all articles