基于PHP采集数据入库程序(二),php采集数据入库_PHP教程
基于PHP采集数据入库程序(二),php采集数据入库
在上篇 基于PHP采集数据入库程序(二) 中提到采集新闻信息页的列表数据,接下来讲讲关于采集新闻具体内容
这是上篇博客的最终数据表截图:
接下来要做的操作就是从数据库中读取所需要采集的URL,进行页面抓取就行
新建一个content表
不过需要注意的一点是,不能再采用采集URL这种id递增的方法去采集,因为数据表中可能出现id断续,比如id=9,id=11,当采集到id=10的时候,URL是空白的,这样可能会导致采集到了空字段。
这里用到的一个技巧是数据库的查询语句,在我们采集完第一条数据的时候,判断数据库里是否还有大于此id的id编号,若有,读取一条,查询信息重复上面的工作。
具体代码如下:
<?<span>php </span><span>include_once</span>("conn.php"<span>); </span><span>$id</span>=(int)<span>$_GET</span>['id'<span>]; </span><span>$sql</span>="select * from list where id=<span>$id</span>"<span>; </span><span>$result</span>=<span>mysql_query</span>(<span>$sql</span><span>); </span><span>$row</span>=<span>mysql_fetch_array</span>(<span>$result</span>);<span>//</span><span>取得对应的url地址</span> <span>$content</span>=<span>file_get_contents</span>(<span>$row</span>['url'<span>]); </span><span>$pattern</span>="/<dd class=\"dataWrap\">(.*)<\/dd>/iUs"<span>; </span><span>preg_match</span>(<span>$pattern</span>, <span>$content</span>,<span>$info</span>);<span>//</span><span>获取内容存放info</span> <span>echo</span> <span>$title</span>=<span>$row</span>[1]."<br/>"<span>; </span><span>echo</span> <span>$content</span>=<span>$info</span>[0]."<hr/>"<span>; </span><span>//</span><span>插入数据库</span> <span>$add</span>="insert into content(title,content) value('<span>$title</span>','<span>$content</span>')"<span>; </span><span>mysql_query</span>(<span>$add</span><span>); </span><span>$sql2</span>="select * from list where id><span>$id</span> order by id asc limit 1"<span>; </span><span>$result2</span>=<span>mysql_query</span>(<span>$sql2</span><span>); </span><span>$row2</span>=<span>mysql_fetch_array</span>(<span>$result2</span>);<span>//</span><span>取得对应的url地址</span> <span>if</span>(<span>$row2</span>['id'<span>]){ </span><span>echo</span> "<script>window.location='content.php?id=<span>$row2</span>[0]'</script>"<span>; } </span>?>
这样子我们所要的新闻内容就采集入库了,接下来只需要对数据的一些样式进行整理就行了。
php数据采集常见技术要领:
1、熟练正则表达式提取数据技术:提取内容关键步骤
2、熟练字符编码转换分析技术:兼容性管理以及数据有效性控制
3、熟练数据出库入库整理技术:对已采集内容的存储管理,包括数据库以及文件和进度
4、发掘数据以及网站爬行技术:分析网站结构,简化爬行手法,提高效率
5、反反采集处理技术:对于存在反采集的目标对象而设计的反反采集技术
6、多服务器并发采集管理技术:提高效率的工作方法
7、数据整理分析技术:查漏验证数据正确性有效性
8、自我身份保护技术:自身信息的保护
php 里有$nr = implode(‘#’,$arr) 方法 ,就可以 了
不过上面的组成的是“内容1#内容2”,没有最后面的一个#,要是必须的话
就是$nr = implode('#',$arr).'#'
在笨的方法,就是用
foreach( $arr as $vl){
$nr.=$vl."#";
}
参考资料:$

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

如何撰写一份完美的PHP程序员求职简历在竞争激烈的就业市场中,一份出色的简历对于求职者来说是至关重要的。对于PHP程序员来说,撰写一份完美的简历尤为重要,因为简历不仅是展示自己技能和经验的窗口,也是吸引雇主注意力的关键。本文将从头到尾详解如何撰写一份完美的PHP程序员求职简历。第一步:选择简洁而具有吸引力的简历模板选择一份简洁而具有吸引力的简历模板是撰写简历

提高求职成功率:写一份优秀的PHP程序员求职简历的技巧在现代社会中,求职已经成为每个毕业生面临的一项重要任务。当谈到求职时,简历是最重要的一环。一份优秀的简历可以为你赢得面试的机会,甚至决定你能否成功获得工作。特别对于PHP程序员这样一个高度竞争的职位来说,如何写一份出众的求职简历,成为每个求职者的关键问题。下面我将分享一些写一份优秀的PHP程序员求职简历的

如何写出一份令雇主眼前一亮的PHP程序员求职简历在竞争激烈的求职市场上,编写一份出色的简历尤为重要。作为PHP程序员,除了令人印象深刻的工作经历和技能,一份简历中也需要体现出你对编程的热爱和扎实的专业知识。本文将介绍一些技巧和代码示例,帮助你编写一份令雇主眼前一亮的PHP程序员求职简历。简洁明了的个人信息简历的个人信息部分应该包括你的姓名、联系方式和个人网站

别再被忽视了!学习如何设计一份令人印象深刻的PHP程序员求职简历在如今竞争激烈的就业市场中,拥有一份令人印象深刻的求职简历是找到理想工作的关键。尤其是对于PHP程序员这样的技术岗位来说,简历是展示自己技能和经验的窗口。本文将带你学习如何设计一份令人印象深刻的PHP程序员求职简历,并附上代码示例。首先,一个好的简历会吸引阅读者的注意力。标题应该简明扼要地说明你

抢眼的PHP程序员求职简历技巧:如何与其他候选人脱颖而出随着互联网行业的快速发展,PHP程序员也成为了求职市场上的热门岗位之一。然而,越来越多的人选择了PHP作为自己的职业发展方向,这就使得竞争变得更加激烈。在这样的情况下,如何让自己的求职简历脱颖而出,成为雇主眼中的香饽饽,是每个PHP程序员都需要思考的问题。首先,一个好的求职简历应该清晰、简明地展示你的技

PHP程序员的高薪逆袭之路随着互联网的快速发展,计算机科学领域的需求不断增加。在这个时代,需要具备编程技能的人才是最受欢迎的。而PHP作为一种常用的编程语言,为程序员们提供了一条高薪逆袭的道路。本文将介绍PHP程序员如何通过学习PHP以及相关技术,走向高薪逆袭之路,并附上一些代码示例。一、掌握PHP基础知识要成为一名优秀的PHP程序员,首先需要掌握PHP的基

探索写作技巧:如何撰写一份引人注目的PHP程序员求职简历在当今竞争激烈的就业市场中,一份引人注目的求职简历对于PHP程序员来说尤为重要。一个好的简历不仅能够吸引雇主的眼球,还能展示你的技能和经验。本文将探索一些写作技巧,帮助你撰写一份出色的PHP程序员求职简历,并附上代码示例,突出你的专业能力。简洁明了的格式简历的格式应该简洁明了,使得雇主能够快速浏览你的关

在当今竞争激烈的就业市场中,如何让自己在众多求职者中脱颖而出成为了一个非常重要的问题。尤其对于PHP程序员来说,良好的求职简历能够直接影响到是否能够得到面试的机会。本文将为大家详细介绍如何写出一份让你脱颖而出的PHP程序员求职简历。首先,一个好的求职简历应该包含以下几个重要部分:个人信息、求职意向、教育背景、工作经历、技能特长和个人项目经验等。我们将逐个部分
