長い間フォーラムに正式に公開していませんでしたが、今日は私のコレクション コードを共有します。 アイデア: 収集プログラムの考え方は非常にシンプルで、大まかに次の手順に分けることができます:
PHP コンテンツをクリップボードにコピーします 上記のコードはすべてのコレクションに使用されるコードです。もちろん、fope を使用して行うこともできます。私は個人的に file_get_contents を使用するのが好きです。 PHP コンテンツをクリップボードにコピーします 以前フォーラムに画像ダウンロード関数を投稿しましたが、皆さんのためにここに投稿します www.bkjia.com true http://www.bkjia.com/PHPjc/508292.html 技術記事 長い間フォーラムに正式に何も公開していなかったので、今日は私のコレクション コードを共有したいと思います。 アイデア: 収集プログラムのアイデアは非常にシンプルで、大まかに次のステップに分けることができます...
1. リモート ファイルのソース コードを取得します (file_get_contents または fopen を使用します) 2. コードを分析してコンテンツを取得します。 want (ここでは正式なマッチングが使用されており、通常はページ分割されます)。
3. ルートから取得したコンテンツをダウンロードして保存します。
PHP コード:
@$nl=file_get_contents($rs[url]);//リモート コンテンツをキャッチします
preg_match_all("/var url = "gameswf/(.*?).swf";/is",$nl,$connect);//形式的なマッチングを実行して、必要なコンテンツを取得します
mysql_query("insert ... . ..データベース部分を挿入");
PHP コード:
if(@copy($url,$newurl)){
echoわかりました
}
PHP コンテンツをクリップボードにコピーします
PHP コード:
/*ローカル画像関数*/
function getimg($url,$filename) ) { /*画像の URL が空かどうかを判断し、空の場合は stop 関数* /
IF ($ url == "") {
Return false;中*/
$ext=strrchr($url,". ");
/*これは合法的な画像ファイルです*/
if($ext!=".gif" && $ext!=".jpg") {
$ を返します。ファイル名.$ext;
}
あなたの個人的な収集に関する考えを共有してください:
1. ホットリンクから保護されているサイトを使用しないでください。実際、出所を偽ることはできますが、そのようなサイトを収集するコストは高すぎます。
2. できるだけ早く、できればローカルでサイトを収集します
3. 収集する場合、最初にデータの一部をデータベースに保存し、後で次の処理ステップを待つことがよくあります。
4. 収集時にエラーを処理する必要があります。収集が 3 回失敗した場合は通常はスキップします。以前は、コンテンツを選択するのに迷ってしまうことがよくありました。
5. データベースに入る前に適切な判断をし、コンテンツの合法性を確認し、不要な文字列をフィルタリングする必要があります。
http://www.bkjia.com/PHPjc/508292.html