php 关于循环的问题!(采集网页内容)

WBOY
풀어 주다: 2016-06-23 13:47:59
원래의
1216명이 탐색했습니다.

我在做论坛内容采集小程序,
本来是这样挑战网页采集的
if  ($_GET[id] $url="http://bbs.misranim.com/thread-".$_GET[id]."-1-1.html";

但是为了方便 我用了while循环 这样
$p=0;
while($p $url="http://bbs.misranim.com/thread-".$p."-1-1.html";
$p++;

问题就出现了,每次遇到被删除的空页面 他也会内容采集到数据库内
用if  ($_GET[id] 用了while 或者 for循环遇到被删除的空页面就出现这样的问题

图:遇到空页面就直接把上一页内容复制进去,比如 第13个帖子有内容,不过第14到17个帖子是被删除的空页面,它就会把13个帖子的内容加到这些里面去,后面也差不多!



用if  ($_GET[id] 13个帖子后面还几个都没有内容,所以直接跳过去,到第22个帖子 这样

我就想要这样的效果

用的是
 if (strlen($txt) > 5)//内容大与5个字符采集到数据库
{     
     $db->insert("INSERT INTO bbs_caiji (col_date,title,txt,url,type,source) VALUES ('".$col_date."','".$title1."','".$txt."','".$url."','BBS','misranim')");
}


为什么用while和for循环就出现这种问题呢?


回复讨论(解决方案)

打错字了,,第一行是跳转 不是挑战

应该不会出现你说的现象

代?不完整,只看提供的代?是?有??的。

每次循?後,都把$txt清?空??。

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿