Webページからデータを収集するプログラムを実行しています。たとえば、このウェブページなどの在庫データ:
昨日のコレクション:18.86元の制限:20.20元
:::: 18.60 Yuan:18.41 Yuan Daily Limit:16.52 Yuanデータ収集のアイデアは簡単で、HTML を取得し、分析して抽出します。取得したい HTML は次のとおりです:
& lt;TD> 1 日あたりの限度額: 20.20 元 & lt;/td & gt;
...
このようにして分析と抽出を行うことができます。しかし、上記のページを確認したところ、その HTML は実際には次のようになっていました:
最高: - | ... 体。 HTML 内の特定のデータではありません。この HTML から必要なデータを抽出できません。
知らない場所に電話をかけると、インターネットからリアルタイムでデータが取得されるようです。なぜなら、ネットワークを切断してこのhtmlファイルを開くと、
すべてのデータが「-」になってしまうからです。インターネットに接続されていれば正常です。この Web ページがデータをどのように取得しているのか知りたいのですが?どのjs関数が調整されましたか?それがどれであるかをどのようにして知ることができますか?
タグに関係があるようです。これらの タグを削除すると、インターネットに接続しているかどうかに関係なく、ブラウザの表示は上記のようになります。しかし、Baidu で タグを確認したところ、フォントにのみ影響することが強調されていましたか?それはデータとどのような関係があるのでしょうか? HTMLとCSSについてはあまり詳しくありませんが、このWebページのリアルタイムデータを取得するにはどうすればよいですか?どうもありがとうございます!
ディスカッションへの返信 (解決策)
http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036
これは、ajax テクノロジーを使用して行われます
ajax の情報を読んで、理解してください
http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http:// hq.sinajs.cn/list=sh600036
私もこの記事を読みましたが、抽出したいのは株式情報だけではありません。私は例を挙げているだけです。 1階のようなWebページからデータを抽出する方法が欲しいだけです
これはajaxによってロードされます。データソース(データの実際のURL)を見つける必要があります
これはによってロードされますajax では、データ ソース (データの実際の URL) を見つける必要があります
これらの実際のデータ ソースを見つける方法を聞きたいのですが?
http://qmx.jrjimg.cn/stocks/pubdata/hotHqData.js
分析スクリプト
ブラウザ f12 ネットワーク タブ レコードの表示