ホームページ > バックエンド開発 > PHPチュートリアル > PHP収集体験スキル_PHPチュートリアル

PHP収集体験スキル_PHPチュートリアル

WBOY
リリース: 2016-07-21 15:46:42
オリジナル
905 人が閲覧しました

1. リモート ファイルのソース コードを取得します (file_get_contents または fopen を使用します)。
2. コードを分析して、必要なコンテンツを取得します (通常はページングを取得するためにここで使用します)。
3. ルートから取得したコンテンツをダウンロードして保存します。

ここでの 2 番目のステップは、数回繰り返す必要がある場合があります。たとえば、最初にページング アドレスを分析し、次に内部ページのコンテンツを分析して、必要なものを取得する必要があります。
コード:
以前コードの一部を投稿したことを思い出しましたので、今日は簡単に投稿します
PHP コンテンツをクリップボードにコピーします
PHP コード:
@$nl=file_get_contents($rs['url']); //リモート コンテンツをキャプチャします
preg_match_all("/var url = "gameswf/(.*?).swf";/is",$nl,$connect);//正式なマッチングを実行して、必要なコンテンツを取得します
mysql_query( "insert...insert データベース部分");
上記のコードは、すべてのコレクションに使用するコードです。もちろん、個人的には file_get_contents を使用することもできます。
ここでローカルフラッシュに写真をダウンロードする方法をシェアします。2行のコードで簡単すぎます
PHPコード:

コードをコピー コードは次のとおりです:

if(@copy($ url,$newurl) ){
echo 'ok'
}

以前フォーラムに画像ダウンロード機能を投稿しましたので、皆さんにも投稿します
*ローカル画像関数*/
function getimg($url) ,$filename){
/*画像のURLが空かどうかを判定し、空の場合は関数を停止します*/ if($url==""){ return false } /*を取得します。画像の拡張子を取得して変数 $ext*/ に格納します
$ext=strrchr($url,".");
/*正当な画像ファイルかどうかを判定します*/
if($ ext!=". gif" && $ext!=".jpg"){
return false;
}
/*画像を読む*/
$img=file_get_contents($url);
/*指定されたファイルを開く*

実は、出所を偽ることは可能ですが、そのようなサイトの収集コストは高すぎます
2. できるだけ早く収集するサイトの場合は、地元で収集するのが最善です
3. 収集する場合、できることが多いです最初にデータの一部をデータベースに保存してから、次のステップの処理に進みます。
4. 収集時にエラーを処理する必要があります。収集が 3 回失敗した場合は通常スキップします。以前は、コンテンツを選択するのに迷ってしまうことがよくありました。
5. データベースに入る前に適切な判断をし、コンテンツの合法性をチェックし、不要な文字列をフィルタリングする必要があります。



http://www.bkjia.com/PHPjc/320119.html

www.bkjia.com

tru​​e

http://www.bkjia.com/PHPjc/320119.html

技術記事

1. リモート ファイルのソース コードを取得します (file_get_contents または fopen を使用します)。 2. コードを分析して、必要なコンテンツを取得します (通常はページングを取得するために、ここでは通常のマッチングを使用します)。 3. ルートからコンテンツを取得します...




ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート