masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > tutorial php > 抓取url和网页内容

抓取url和网页内容

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Lepaskan： 2016-06-23 14:38:32

asal

875 orang telah melayarinya

由于技术不够，整天在逛论坛。看到许多关于抓取网页内容（file_get_contents）和抓取url（这个不知道用什么）对这个听感兴趣。望大神指点下这是怎么回事？最好能帮我整个源码嘎嘎。叫我参考下。

回复讨论(解决方案)

自己百度先吧

我用 php socket 和 curl写过真实的例子，至于 file_get_contents更简单了，原理都一样，你看以看看
不足之处请指点，
http://blog.csdn.net/zkg510168343/article/details/12996699
http://blog.csdn.net/zkg510168343/article/details/16983161

curl
手册里有例子，必须要看手册阿

百度一下，可以找到很多的。

百度 php 采集

baidu下 file_get_contents()和curl 抓取采集

$url='http://www.iheima.com/';
$con=file_get_contents($url);
if ($con){

preg_match_all('/

(.+).*
(.+)/isU', $con, $temp,PREG_SET_ORDER);
foreach ($temp as $key=> $v){
$title=$v[2];
$v_url=$v[1];
$des=$v[3];
$con_url=file_get_contents($v_url);
if ($con_url){
$tags='';
preg_match('/keywords" content="(.+)"/isU', $con_url,$tags);
$tags=trim($tags[1],',');

preg_match('/class="txs_Content".*>(.+)/isU', $con_url,$txt);
$txt=$txt[1];
}

}
} 够清楚了吧

有个开源的simple_html_dom
$html = file_get_html('http://www.baidu.com');
可以根据各种抓取，如id,css等方法抓取网页内容

Label berkaitan：

抓取url和网页内容

Artikel sebelumnya：请教会多种编程语言的朋友：当初是怎么克服对第一语言的依赖的？ Artikel seterusnya：CakePHP求救求救~

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Bagaimana LLMS Berfungsi: Pra-latihan ke Latihan Pasca, Rangkaian Neural, Hallucinations, dan Kesimpulan

2025-02-26 03:58:14
Saya menggabungkan blockchain dan AI untuk menjana seni. Di sini ’ s Apa yang berlaku seterusnya.

2025-02-26 03:38:10
Kejuruteraan Prompt Lanjutan: Rantai Pemikiran (COT)

2025-02-26 03:17:10
Pengambilan semula Generasi Tambahan di SQLite

2025-02-26 02:49:09
Cara menggunakan boilerplate berkuasa LLM untuk membina API Node.js anda sendiri

2025-02-26 01:08:13
LLMS untuk pengekodan pada tahun 2024: harga, prestasi, dan pertempuran untuk yang terbaik

2025-02-26 00:46:10
Mendorong model bahasa penglihatan

2025-02-25 23:42:08
Cara Mengukur Kebolehpercayaan Respons Model Bahasa Besar

2025-02-25 22:50:13
Ilusi hidup

2025-02-25 21:54:11
Para saintis serius mengenai model bahasa besar yang mencerminkan pemikiran manusia

2025-02-25 20:45:11

Isu terkini

javascript - Sila beritahu saya tentang masalah menukar fungsi panggil balik jq untuk menjanjikan pelaksanaan

daripada 1970-01-01 08:00:00

0

0

0

javascript - Kekeliruan tentang menghantar parameter dalam tindak balas

daripada 1970-01-01 08:00:00

0

0

0

javascript - gambar rajah tindanan atribut js

daripada 1970-01-01 08:00:00

0

0

0

javascript - aplikasi halaman tunggal angularjs Bagaimana untuk menyelesaikan masalah tidak menatal ke bahagian atas halaman selepas halaman menatal ke bawah dan navigasi melompat ke halaman baharu?

daripada 1970-01-01 08:00:00

0

0

0

javascript - Apabila membina projek dengan vue-cli, anda perlu memperkenalkan fail js dan CSS statik tempatan Bagaimana untuk membungkusnya?

daripada 1970-01-01 08:00:00

0

0

0

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan