Tmall New Balance 旗艦店の商品データの収集、Tmall New Balance 旗艦店_PHP チュートリアル
Jul 13, 2016 am 10:14 AM天猫ニューバランス旗艦店、天猫ニューバランス旗艦店の商品データを収集
1. Fire Spider Collectorをダウンロードします
Fire Spider Collector ダウンロードアドレス:
http://firespider.duapp.com/FireSpiderWeb/index.html
2.インストール
Fire Spider Collector には、クライアントとサーバーのインストール パッケージが含まれています。インストールは非常に便利で、次のステップで完了できます。具体的なインストール手順については、付属のインストールマニュアルを参照してください。
3.起動
サーバーを起動します:デスクトップに「Fire Spiderサーバー起動」というショートカットがありますので、右クリック→管理者として実行します。
クライアントを起動します: デスクトップのショートカット「FireSpider」をダブルクリックします
4. 試してみる
インストール後、デフォルトでいくつかの収集タスクが含まれます。以下の図に示すようにクライアントを開き、タスクを選択して「収集の実行」をクリックします。
収集が開始されたことがわかります。
収集を停止する必要がある場合は、収集タスクを選択し、「収集の実行」ボタンの横にある「終了」をクリックします。
5. ニューバランスタスクを作成します
インストール後、Luotuo Tmallストアを収集するタスク「Luotuoリストページ」がデフォルトで含まれています。これを参照して独自のタスクを構築するだけです。たとえば、「New Balance Flagship Store」を収集したい場合、Tmallで「New Balance」を検索し、New Balance Tmallストアに入り、New Balanceのリストページを見つけます。リンクは次のとおりです。
http://newbalance.tmall.com/search.htm?spm=a220m.1000858.1000725.4.vvTbdj&rn=bda5ce8edbc3307bf802e68880861de3&user_number_id=520557274
次に、New Balanceを収集するタスクを作成します
ブラウザに http://localhost:8090/FireSpider/html/index.html を出力して管理センターを開きます
「タスク名」「リンク」「データアップロードリンク」以外は「ラクダ一覧ページ」と同じです。先ほどのNew Balance一覧ページへのリンクを埋め込みます。
「データ アップロード リンク」フィールドに注意してください。これは、コレクターがデータを収集するときに、POST モードでデータをこのリンクにプッシュします。コレクターは、収集されたデータが何に使用されるかを知らないため、データの処理を私たちに任せる必要があります。 Apache、Tomcat、iis などの REST サービスをローカルで開くことができます。
ここでは、「データアップロードリンク」を「http://localhost/myphp/index.php」として入力します。ここではPHPを使用します。この PHP スクリプトについては後ほど説明します。
コレクションを体験したいだけの場合は、「データアップロードリンク」を空白のままにすることもできます。
クリックして保存
6. WAMP を構築する
収集したデータを自分で処理する必要がない場合、この手順は必要ありません。ここで話しているのは PHP カスタム コレクションのデータ処理であり、他の言語をスキップすることもできます。
6.1 wampをインストールする
これは言うまでもありませんが、次のステップを踏み続けてください。
6.2 エイリアスの作成
エイリアス名を入力してください
[php] プレーンコピーを表示
- <?php
- //PHP ファイルは UTF-8 BOM フリー形式で保存する必要があることに注意してください
- //POST からデータを取得します
- // firespider は投稿時にコンテンツ タイプを設定しないため、投稿データを取得するにはこのメソッドを使用する必要があり、$_POST は使用できません
- $content = file_get_contents("php://input"); // JSON デコード
- $p = json_decode($content);
- // 後で独自のロジックを作成できます。これはファイルに保存されるだけです
- $james= fopen(
- "e:/test/json-".$p->urlId.".txt", "w");
- if(!$ジェームズ) { echo'ファイルが存在しません';
- 終了
- }
- fwrite(
- $ジェームズ, $コンテンツ); fclose($ジェームズ)
- 7. ニューバランスを集める
- タスクが作成されたら、収集を開始できます。コレクタークライアントを開き、タスクタブで作成したばかりの「New Balance」を選択し、「コレクションの実行」をクリックします
http://www.bkjia.com/PHPjc/908455.html
www.bkjia.com
true
http://www.bkjia.com/PHPjc/908455.html
技術記事
Tmall New Balance 旗艦店、Tmall New Balance 旗艦店の商品データを収集する 1. Fire Spider コレクターをダウンロード Fire Spider コレクターのダウンロード アドレス: http://firespider.duapp.com/FireSpiderWeb/index....

人気の記事

人気の記事

ホットな記事タグ

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定!

Quark Network Diskからファイルをダウンロードする場所_Quark Network Diskをローカルエリアにダウンロードして共有する方法

超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。

Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります
