JSを使用してページ分割されたWebページのコンテンツをクロールする方法を教えてください
JS を使用してページ分割された Web ページのコンテンツをクロールする方法を教えてください
Web サイトのコンテンツをクロールしたいのですが、この Web サイトのページング メカニズムは JS を使用しています。詳細は次のとおりです:
[size=10px]
- HTML コード
<!-- Code highlighting produced by Actipro CodeHighlighter (freeware) http://www.CodeHighlighter.com/ --><a href="javascript:gogage(pageno+1)" class="navigation">下一页</a>
- JScript コード
<!-- Code highlighting produced by Actipro CodeHighlighter (freeware) http://www.CodeHighlighter.com/ --> var pageno=1; function gogage(pno){ tbl.firstPage(); pageno=1; for(var i=1; (i < pno||pno==-1)&&i<xmldso.recordset.PageCount; i++,pageno++) tbl.nextPage(); document.all.currentpage.innerText=pageno; }
- HTML コード
<!-- Code highlighting produced by Actipro CodeHighlighter (freeware) http://www.CodeHighlighter.com/ --> <table width="98%" border="0" cellspacing="1" cellpadding="1" id="tbl" datasrc="#xmldso" datapagesize="11">
アドバイスをお願いします。
-----解決策---------
助けて!
------解決策---------
データは「#」にある HTML ページを削除します。 xmldso」も削除すると、内容はこれですべてです。ページングとは関係ありません。
------解決策------------------
助けて!
------解決策---------
htmlparser を使用して Web コンテンツをキャプチャする (1)
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags 。 TableTag;
import org.htmlparser.util.NodeList;
/**
*
* タイトル:
* 機能概要:
* 著作権: cityyouth.cn (c) 2005
*会社名: Shanghai Urban Youth Network
* 作成時刻: 2005-12-21
* 修正時刻:
* 修正理由:
*
* @作者 Zhang Wei
* @バージョン 1.0
*/
public class TestYahoo {
public static void testHtml() {
try {
文字列 sCurrentLine;
文字列 sTotalString;
sCurrentLine = "";
sTotalString = "";
java.io.InputStream l_urlStream;
java.net.URL l_url = 新しい java .net.URL(
"http://sports.sina.com.cn/iframe/nba/live/");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(
new java.io .InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null) {
sTotalString += sCurrentLine;
}
System.out.println(sTotalString) ;
System.out.println("========================);
String testText = extractText(sTotalString);
System.out.println(testText);
} catch (例外 e) {
e.printStackTrace();
}
}
/**
* プレーンテキスト情報を抽出
*
* @param inputHtml
* @return
*/
public static String extractText(String inputHtml) throws Exception {
StringBuffer text = new StringBuffer();
パーサー parser = Parser.createParser(new String(inputHtml.getBytes() ,
"8859_1"), "8859-1");
// すべてのノードを走査します
NodeList ノード = parser.extractAllNodesThatMatch(new NodeFilter() {
public boolean accept(Node node) {
true を返します。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Java の Weka へのガイド。ここでは、weka java の概要、使い方、プラットフォームの種類、利点について例を交えて説明します。

この記事では、Java Spring の面接で最もよく聞かれる質問とその詳細な回答をまとめました。面接を突破できるように。

Java 8は、Stream APIを導入し、データ収集を処理する強力で表現力のある方法を提供します。ただし、ストリームを使用する際の一般的な質問は次のとおりです。 従来のループにより、早期の中断やリターンが可能になりますが、StreamのForeachメソッドはこの方法を直接サポートしていません。この記事では、理由を説明し、ストリーム処理システムに早期終了を実装するための代替方法を調査します。 さらに読み取り:JavaストリームAPIの改善 ストリームを理解してください Foreachメソッドは、ストリーム内の各要素で1つの操作を実行する端末操作です。その設計意図はです

Java での日付までのタイムスタンプに関するガイド。ここでは、Java でタイムスタンプを日付に変換する方法とその概要について、例とともに説明します。

カプセルは3次元の幾何学的図形で、両端にシリンダーと半球で構成されています。カプセルの体積は、シリンダーの体積と両端に半球の体積を追加することで計算できます。このチュートリアルでは、さまざまな方法を使用して、Javaの特定のカプセルの体積を計算する方法について説明します。 カプセルボリュームフォーミュラ カプセルボリュームの式は次のとおりです。 カプセル体積=円筒形の体積2つの半球体積 で、 R:半球の半径。 H:シリンダーの高さ(半球を除く)。 例1 入力 RADIUS = 5ユニット 高さ= 10単位 出力 ボリューム= 1570.8立方ユニット 説明する 式を使用してボリュームを計算します。 ボリューム=π×R2×H(4

Java は、初心者と経験豊富な開発者の両方が学習できる人気のあるプログラミング言語です。このチュートリアルは基本的な概念から始まり、高度なトピックに進みます。 Java Development Kit をインストールしたら、簡単な「Hello, World!」プログラムを作成してプログラミングを練習できます。コードを理解したら、コマンド プロンプトを使用してプログラムをコンパイルして実行すると、コンソールに「Hello, World!」と出力されます。 Java の学習はプログラミングの旅の始まりであり、習熟が深まるにつれて、より複雑なアプリケーションを作成できるようになります。
