> 백엔드 개발 > PHP 튜토리얼 > 关于快讯采集,仅提取频道列表中新增项

关于快讯采集,仅提取频道列表中新增项

WBOY
풀어 주다: 2016-06-13 12:57:31
원래의
830명이 탐색했습니다.

关于新闻采集,仅提取频道列表中新增项
做新闻采集程序,以腾讯的某频道为例“http://tech.qq.com/hlwxw.htm” 。每30分钟上来扫描看看有没有新增新闻,可能上面频道的列表增加了两条,其他23条都是已经抓完的了(一共25条的列表),仅把这两条能出来放进数据库,请问应该怎样做??


------解决方案--------------------
每抓一条新闻,都把那条新闻的id存储在你的表里。比如

exists_id
----------
1231
1232
1233
...


采集的时候,先判断下这条新闻的id是否在你那个表里存在。。。
然后就不用说了
관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿