社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > php教程 > 如何抓取网页实时内容

如何抓取网页实时内容

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-23 14:09:04

原创

1138 人浏览过

#网址：http://data.shishicai.cn/cqssc/haoma/#Demo：<?php/* Created on [2013-5-1] Author[Newton] Filename[action.php]*/#编码转换function convToUtf8($str) {	if (mb_detect_encoding($str, "UTF-8, ISO-8859-1, GBK") != "UTF-8") {		return iconv("GBK", "utf-8", $str);	} else {		return $str;	}}header("content-type:text/html;charset:utf-8");error_reporting(E_ERROR);$pages = file_get_contents('http://data.shishicai.cn/cqssc/haoma/');//$pages = htmlspecialchars($pages);$pages = convToUtf8($pages);echo "pages-->>".print_r($pages);echo PHP_EOL;$doc = new DOMDocument();$new_doc = new DOMDocument('1.0', 'utf-8');echo "doc-->>".print_r($doc);echo PHP_EOL;$dom = $doc->getElementsByTagName('table');$newdoc = $new_doc->loadhtml($dom->item(2)->nodeValue);$table = $new_doc->saveHTML();echo "table-->>{$table}".PHP_EOL;#result：#……乱码……#pages-->>1 DOMDocument Object ( ) doc-->>1 table-->>#table是空的……?>

登录后复制

回复讨论(解决方案)

我想获取的内容是：

对应代码片段：

页面数据是JS填充的。你得爬那个JS脚本。

貌似这样做繁琐了吧?

貌似是用了frame框架内嵌在tbody里面，然后用JS代码来做html。
打开http://datacache.shishicai.cn/script/2f67117ba1b58074.js后，
搜索'frame'出来6条结果
凭我的技术分析是不出框架的链接

LZ看来也是位大神，技术分好高，仰望ING

http://data.shishicai.cn/handler/kuaikai/data.ashx
post: lottery=4&date=2013-05-06
采集这儿.

楼上链接抓的是空白……

相关标签：

如何抓取网页实时内容

来源：php.cn

上一篇：coreseek 全文搜索的问题下一篇：为什么我无法实现页面的跳转啊？

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

hyperf框架如何模拟登录抓取网页内容？

来自于 1970-01-01 08:00:00

0

0

0

使用PHP抓取网页内容时报错

来自于 1970-01-01 08:00:00

0

0

0

Python 爬虫遇到的问题（手淘问大家）

来自于 1970-01-01 08:00:00

0

0

0

Python如何利用Selenium或者PhantomJS爬取动态网页内容

来自于 1970-01-01 08:00:00

0

0

0

python - 用scrapy爬取网站内容时，如何忽略某些内容为空的值；

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1429443
php入门教程之一周学会PHP

4281054
JAVA 初级入门视频教程

2594623
小甲鱼零基础入门学习Python视频教程

511355
PHP 零基础入门教程

869583

最新下载

更多>

网站特效

网站源码

网站素材

前端模板