長い間フォーラムに正式に何も公開していませんでしたが、今日は私のコレクションコードを共有します。
アイデア:
収集プログラムの考え方は非常にシンプルで、大まかに次のステップに分けることができます:
1. リモートファイルのソースコードを取得します(file_get_contents または fopen を使用します)。
2. コードを分析して、必要なコンテンツを取得します (ここでは通常のマッチングを使用し、通常はページネーションを取得します)。3. ルートから取得したコンテンツをダウンロードして保存します。
ここでの 2 番目のステップは、数回繰り返す必要がある場合があります。たとえば、最初にページング アドレスを分析し、次に内部ページのコンテンツを分析して、必要なものを取得する必要があります。
コード:
以前にコードの一部を投稿したことを思い出しましたが、今日はそれをここに投稿します。
PHP コンテンツをクリップボードにコピーします
PHPコード:
@$nl=file_get_contents($rs[url]);//リモートコンテンツをキャッチ
preg_match_all("/var url = "gameswf/(.*?).swf";/is",$nl,$connect);//正式なマッチングを実行して、必要なコンテンツを取得します
mysql_query("insert...データベース部分を挿入");
上記のコードはすべてのコレクションに使用されるコードです。もちろん、fope を使用して実行することもできます。個人的には file_get_contents を使用します。
次に、Flash 画像をローカルにダウンロードする方法を共有します。コードは 2 行だけでとても簡単です
PHP コンテンツをクリップボードにコピーします
PHPコード:
if(@copy($url,$newurl)){
エコーOK;
}
以前フォーラムに画像ダウンロード機能を投稿しましたが、皆さんのためにここに投稿します
PHP コンテンツをクリップボードにコピーします
PHPコード:
/*ローカル画像機能*/
関数 getimg($url,$filename){
/*画像のURLが空かどうかを判定し、空の場合は関数を停止します*/
if($url==""){
return false;
}
/*画像の拡張子を取得し、変数 $ext*/
に保存します
$ext=strrchr($url,".");
/*合法的な画像ファイルかどうかを判断します*/
if($ext!=".gif" && $ext!=".jpg"){
return false;
}
/*画像を読む*/
$img=file_get_contents($url);
/*指定されたファイルを開きます*/
$fp=@fopen($filename.$ext,"a");
/*指定されたファイルに画像を書き込みます*/
fwrite($fp,$img);
/*ファイルを閉じる*/
fclose($fp);
/*画像の新しいファイル名を返します*/
$filename.$ext;を返します
}
あなたの個人的なコレクション体験を共有してください:
1. ホットリンクから保護されているサイトを使用しないでください。実際、出自を偽ることはできますが、そのようなサイトを収集するコストは高すぎます
。2. できるだけ早く、できればローカルでサイトを収集します
3. 収集する場合、最初にデータの一部をデータベースに保存してから、次の処理ステップに進むことがよくあります。
4. 収集時にエラーを処理する必要があります。収集が 3 回失敗した場合は通常スキップします。以前は、コンテンツを選択するのに迷ってしまうことがよくありました。
5. データベースに入る前に適切な判断をし、コンテンツの合法性をチェックし、不要な文字列をフィルタリングする必要があります。
http://www.bkjia.com/PHPjc/486533.html