ノードが Web ページから画像をクロールする方法 (コードは添付)-jsチュートリアル-php.cn

ディレクトリ

ノードをインストールします

サーバーを構築します

クロールしたいページをリクエストします

ホームページ

ウェブフロントエンド

jsチュートリアル

ノードが Web ページから画像をクロールする方法 (コードは添付)

不言

Aug 17, 2018 pm 03:45 PM

この記事の内容は、ノードがWebページから画像をクロールする方法についてです（コード付き）。必要な友人が参考になれば幸いです。

ディレクトリ

ノードをインストールして依存関係をダウンロードします
サービスを構築します
クロールしたいページをリクエストしてjsonを返します

ノードをインストールします

ノードのインストールを開始します。公式 Web サイト https://nodejs.org/zh-cn/ からダウンロードします。ダウンロードが完了したら、node を実行して使用します。

node -v

ログイン後にコピー

インストールが成功すると、インストールしたバージョン番号が表示されます。

次に、node を使用して hello world を出力し、index.js という名前の新しいファイルを作成して入力します

console.log(&#39;hello world&#39;)

ログイン後にコピー

このファイルを実行すると

node index.js

ログイン後にコピー

、コントロールパネルに hello world が出力されます

サーバーを構築します

新しい名前はノードのフォルダーです。

まず、Express の依存関係をダウンロードする必要があります

npm install express

ログイン後にコピー

次に、以下に示すようなディレクトリ構造で、demo.js という名前の新しいファイルを作成します:

ダウンロードした Express を demo.js に導入します

const express = require(&#39;express&#39;);
const app = express();
app.get(&#39;/index&#39;, function(req, res) {
res.end(&#39;111&#39;)
})
var server = app.listen(8081, function() {
    var host = server.address().address
    var port = server.address().port
    console.log("应用实例，访问地址为 http://%s:%s", host, port)

})

ログイン後にコピー

ノードのデモを実行します。 js シンプルなサービス図に示すようにセットアップされています。

クロールしたいページをリクエストします

npm install superagent
npm install superagent-charset
npm install cheerio

ログイン後にコピー

Superagent は、軽量でプログレッシブな Ajax API です。可読性が高く、学習時間が短く、nodejs 環境に適した、nodejs ネイティブリクエスト API への内部依存性があり、クロールされたデータの文字化けを防ぐために http を使用してリクエストを開始したり、文字形式を変更したりすることもできます

。 Cheerio からサーバー用に特別にカスタマイズされた、高速かつ柔軟で実装された jQuery コア実装。依存関係をインストールした後、それを導入できます

var superagent = require(&#39;superagent&#39;);
var charset = require(&#39;superagent-charset&#39;);
charset(superagent);
const cheerio = require(&#39;cheerio&#39;);

ログイン後にコピー

導入後、図に示すように、アドレス https://www.qqtn.com/tx/weixintx_1.html をリクエストします:

アドレスを宣言します変数:

const baseUrl = &#39;https://www.qqtn.com/&#39;

ログイン後にコピー

these 設定後、リクエストを送信します。次に、完全なコードをご覧ください。demo.js

var superagent = require(&#39;superagent&#39;);
var charset = require(&#39;superagent-charset&#39;);
charset(superagent);
var express = require(&#39;express&#39;);
var baseUrl = &#39;https://www.qqtn.com/&#39;; //输入任何网址都可以
const cheerio = require(&#39;cheerio&#39;);
var app = express();
app.get(&#39;/index&#39;, function(req, res) {
    //设置请求头
    res.header("Access-Control-Allow-Origin", "*");
    res.header(&#39;Access-Control-Allow-Methods&#39;, &#39;PUT, GET, POST, DELETE, OPTIONS&#39;);
    res.header("Access-Control-Allow-Headers", "X-Requested-With");
    res.header(&#39;Access-Control-Allow-Headers&#39;, &#39;Content-Type&#39;);
    //类型
    var type = req.query.type;
    //页码
    var page = req.query.page;
    type = type || &#39;weixin&#39;;
    page = page || &#39;1&#39;;
    var route = `tx/${type}tx_${page}.html`
    //网页页面信息是gb2312，所以chaeset应该为.charset(&#39;gb2312&#39;)，一般网页则为utf-8,可以直接使用.charset(&#39;utf-8&#39;)
    superagent.get(baseUrl + route)
        .charset(&#39;gb2312&#39;)
        .end(function(err, sres) {
            var items = [];
            if (err) {
                console.log(&#39;ERR: &#39; + err);
                res.json({ code: 400, msg: err, sets: items });
                return;
            }
            var $ = cheerio.load(sres.text);
            $(&#39;div.g-main-bg ul.g-gxlist-imgbox li a&#39;).each(function(idx, element) {
                var $element = $(element);
                var $subElement = $element.find(&#39;img&#39;);
                var thumbImgSrc = $subElement.attr(&#39;src&#39;);
                items.push({
                    title: $(element).attr(&#39;title&#39;),
                    href: $element.attr(&#39;href&#39;),
                    thumbSrc: thumbImgSrc
                });
            });
            res.json({ code: 200, msg: "", data: items });
        });
});
var server = app.listen(8081, function() {

    var host = server.address().address
    var port = server.address().port

    console.log("应用实例，访问地址为 http://%s:%s", host, port)

})

ログイン後にコピー

demo.js を実行すると、図に示すように、取得したデータが返されます。簡易ノードクローラが完成しました。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7563

CakePHP チュートリアル

1385

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

フロントエンドのサーマルペーパーレシートのために文字化けしたコード印刷に遭遇した場合はどうすればよいですか？ Apr 04, 2025 pm 02:42 PM

フロントエンドのサーマルペーパーチケット印刷のためのよくある質問とソリューションフロントエンド開発におけるチケット印刷は、一般的な要件です。しかし、多くの開発者が実装しています...

誰がより多くのPythonまたはJavaScriptを支払われますか？ Apr 04, 2025 am 12:09 AM

スキルや業界のニーズに応じて、PythonおよびJavaScript開発者には絶対的な給与はありません。 1. Pythonは、データサイエンスと機械学習でさらに支払われる場合があります。 2。JavaScriptは、フロントエンドとフルスタックの開発に大きな需要があり、その給与もかなりです。 3。影響要因には、経験、地理的位置、会社の規模、特定のスキルが含まれます。

JavaScriptを使用して、同じIDを持つArray要素を1つのオブジェクトにマージする方法は？ Apr 04, 2025 pm 05:09 PM

同じIDを持つ配列要素をJavaScriptの1つのオブジェクトにマージする方法は？データを処理するとき、私たちはしばしば同じIDを持つ必要性に遭遇します...

javascriptの分解：それが何をするのか、なぜそれが重要なのか Apr 09, 2025 am 12:07 AM

JavaScriptは現代のWeb開発の基礎であり、その主な機能には、イベント駆動型のプログラミング、動的コンテンツ生成、非同期プログラミングが含まれます。 1）イベント駆動型プログラミングにより、Webページはユーザー操作に応じて動的に変更できます。 2）動的コンテンツ生成により、条件に応じてページコンテンツを調整できます。 3）非同期プログラミングにより、ユーザーインターフェイスがブロックされないようにします。 JavaScriptは、Webインタラクション、シングルページアプリケーション、サーバー側の開発で広く使用されており、ユーザーエクスペリエンスとクロスプラットフォーム開発の柔軟性を大幅に改善しています。

Console.log出力の違い結果：なぜ2つの呼び出しが異なるのですか？ Apr 04, 2025 pm 05:12 PM

Console.log出力の違いの根本原因に関する詳細な議論。この記事では、Console.log関数の出力結果の違いをコードの一部で分析し、その背後にある理由を説明します。 �...

初心者向けのタイプスクリプト、パート2：基本データ型 Mar 19, 2025 am 09:10 AM

エントリーレベルのタイプスクリプトチュートリアルをマスターしたら、TypeScriptをサポートするIDEで独自のコードを作成し、JavaScriptにコンパイルできるはずです。このチュートリアルは、TypeScriptのさまざまなデータ型に飛び込みます。 JavaScriptには、NULL、未定義、ブール値、数字、文字列、シンボル（ES6によって導入）とオブジェクトの7つのデータ型があります。 TypeScriptはこれに基づいてより多くのタイプを定義し、このチュートリアルではすべてを詳細に説明します。ヌルデータ型 JavaScriptのように、Typescriptのnull

Shiseidoの公式Webサイトのように、視差スクロールと要素のアニメーション効果を実現する方法は？または： Shiseidoの公式Webサイトのようにスクロールするページを伴うアニメーション効果をどのように実現できますか？ Apr 04, 2025 pm 05:36 PM

この記事の視差スクロールと要素のアニメーション効果の実現に関する議論では、Shiseidoの公式ウェブサイト（https://www.shisido.co.co.jp/sb/wonderland/）と同様の達成方法について説明します。

PowerPointはJavaScriptを実行できますか？ Apr 01, 2025 pm 05:17 PM

JavaScriptはPowerPointで実行でき、外部JavaScriptファイルを呼び出したり、VBAを介してHTMLファイルを埋め込んだりすることで実装できます。 1. VBAを使用してJavaScriptファイルを呼び出すには、マクロを有効にし、VBAプログラミングの知識を持つ必要があります。 2。JavaScriptを含むHTMLファイルを埋め込みます。これは、シンプルで使いやすいが、セキュリティ制限の対象となります。利点には、拡張機能と柔軟性が含まれますが、欠点にはセキュリティ、互換性、複雑さが含まれます。実際には、セキュリティ、互換性、パフォーマンス、ユーザーエクスペリエンスに注意を払う必要があります。

See all articles

ノードが Web ページから画像をクロールする方法 (コードは添付)

ディレクトリ

ノードをインストールします

サーバーを構築します

クロールしたいページをリクエストします

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック