質問: データ収集の問題 - コンテンツは AJAX によって動的にロードされます
最近 PHP データ収集について読んでいましたが、Dangdang.com の週間ランキング リストなど、いくつかの Web サイト コンテンツを収集するときに大きな問題に遭遇しました: bang。 dangdang.com/book/bestSeller/ ページからも、これらのリスト データは AJAX によって取得されており、分析のためにソース コードを直接取得することはできません。その内容の取得は次の AJAX コードによって読み込まれていることがわかりました。 🎜> //動的呼び出し Right content
$.ajax({
url: "contentList.php?catpath="+ strCatPath + "&type=" + strType + "&year=" + str Year + "&month=" + strMonth + "&range =" + strRange,
キャッシュ: false,
タイプ: "POST",
データ: "catTitleName="+catTitleName+"&catTitleOther="+catTitleOther,
成功: 関数(html){
$("#divContentDateList").css("display","none");
$("#divContentDateList").html(html);
$("#divContentDateList ").fadeIn( "slow");
}
});
ここでわかるように、これらのリストの内容は contentList.php から取得され、返された内容は html 変数内にあります。次に何をすべきでしょうか? contentList.php を要求する AJAX ファイルもローカルに作成する必要がありますか? それとも、この種の AJAX では、HTML 値を取得してからデータを収集する必要がありますか?
1. JS を自分で記述し、そのサーバー スクリプトをリクエストし、返されたコンテンツを取得します
2. 返されたコンテンツを取得します
実際の操作では、どちらが使われますか?そして、それを取得する方法はお兄さんやお姉さんに教えてもらいます、ありがとうございます
-----解決策----------- ----------
収集されたコンテンツを取得するには、contentList.php を自分で記述する必要があります
これを実現するには、cURL と正規表現を使用できます
------解決策------------------
ソース プログラムでは、AJAX を使用してユーザー情報を取得し、それを contentList.php に転送してさらに処理する必要があります。情報は何らかの処理を受ける必要があります。処理結果がページに返され、ページが応答します。