php利用fopen实现简单的网页采集程序
这个采集程序是一个非常简单的程序了,个人认为不适合于大量数据采集了单页还是没有问题了,因为fopen函数对于远程文件操作与多线程时是非常的不理想的,这个只是一个作者写的觉得好玩合出来了,代码如下:
<?php /** * 根据URL采集网页内容 * * @param string $url 链接地址 * @return string */ private function fetchbyurl($url) { $handle = fopen($url, 'r'); $content = "; while (!feof($handle)){ $content .= fgets($handle, 10000); } return $content; //?$this->utf8_iconv($content):"; } /*获取所有匹配的内容 * @param string $str 内容 * @param string $start 起始匹配 * @param string $end 中止匹配 * @return array */ private function utf8_iconv($content) { return iconv('GBK', 'UTF-8', $content); } private function strCutAll($str, $start, $end) { $content = explode($start, $str); $matchs = array(); $sum = count($content); for ($i = 1; $i < $sum; $i++) { $tmp = explode($end, $content[$i]); $matchs[] = $tmp[0]; unset($tmp); } return $matchs; } /*获取第一个匹配的内容 * @param string $str 内容 * @param string $start 起始匹配 * @param string $end 中止匹配 * @return string */ private function strCut($str, $start, $end) { $content = strstr($str, $start); $content = substr($content, strlen($start) , strpos($content, $end) - strlen($start)); return $content; } ?>
Salin selepas log masuk
/*采集程序*/ header("content-Type: text/html; charset=utf-8"); //$nr = file_get_contents(‘/webback/php/php-yi-ju-hua-hou-men-zhuan’); $nr = $this->fetchbyurl(‘/webback/php/php-yi-ju-hua-hou-men-zhuan’); //推荐,还可以用curl dump($this->strCut($nr,’<div class="context">’,'<div class="betterrelated">’)); //得到内容。需要进一步过滤用(preg_match_all) dump($this->strCutAll($nr,’<title>’,'</title>’)); 得到标题
Salin selepas log masuk
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas
R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu
By 尊渡假赌尊渡假赌尊渡假赌
Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?
1 bulan yang lalu
By DDD
R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?
1 bulan yang lalu
By DDD
R.E.P.O. Tetapan grafik terbaik
2 minggu yang lalu
By 尊渡假赌尊渡假赌尊渡假赌
Assassin's Creed Shadows: Penyelesaian Riddle Seashell
1 minggu yang lalu
By DDD

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)
