ホームページ > php教程 > php手册 > 新浪ニュース泥棒

新浪ニュース泥棒

WBOY
リリース: 2016-06-13 12:44:25
オリジナル
1216 人が閲覧しました


新浪ニュース泥棒 1.






< ;title>Sina_News クローラー



$host="127.0.0.1"; // MYSQL ホスト名
$namesql="????"; // MYSQL ユーザー名
$passsql="? ???"; // MYSQL パスワード
$lib="news"; // データベース名
$table="news"; // データベーステーブル名
$filename=" http://news .sina.com.cn/news1000/index.shtml"; // 取得したニュースページ
$keytop="ニュース開始"; // ニュース開始キーワード
$keybottom=" ニュース終了"; // 終了ニュースキーワードの

$conn=mysql_connect($host,$namesql,$passsql);
mysql_select_db($lib,$conn);

$ fp=fopen($filename, "r",1);$add=0; $temp[4]=";
!$end==1){
while(!$flag==1){
$word=fgetc($fp);
$add=$add.$ word;
if( $word=='<' および strlen($add)==1){ $flag=0; }
if($word=='<' および strlen($add )!=1){ $フラグ=1;​​ $add=substr($add,0,strlen($add)-1); }
if($word=='>'){ $flag=1 }

if(strchr($add,$keytop)){ $found=1; }
if(strchr($add,$keybottom)){ $end= 1; }
if (((strchr($add,'<')==True および strchr($add,'href')==True) または strchr($add,'<')== False) および $found== 1){ $text[$i]=$i ; }
if($word=='<' および $flag==1); else { $add=""; } }
fclose($fp);

for($i=1;$i$temp[1]=$text[$i 1]; $temp[2]=$text[$i 3]; temp[4]=$text[$i 4];
$ins="select * from $table where TITLE='$temp[3]'";
$list= mysql_query($ins,$conn );
@$count=mysql_num_rows($list);
if($count==0){
$ins="$table(TYPE,URL, TITLE,DATE) 値に挿入('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";
$list=mysql_query($ins ,$conn); } }
mysql_close($conn);
?>






2. $handle = fopen("http://news.sina.com.cn/news1000/","r");
$sign = 0;ハンドル))
{
$message = fgets($handle,512);
if($sign == 1)
{
print("$message" ); }
if(ereg("ニュース開始",$message,$result))
{
$sign = 1;
}
else if(ereg("ニュース終了",$メッセージ,$結果))
{
$sign = 0;
}
}
fclose($handle);

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート