node如何爬取網頁中的圖片（附程式碼）-js教程-PHP中文網

安裝node

建置伺服器

首頁

web前端

js教程

node如何爬取網頁中的圖片（附程式碼）

不言

Aug 17, 2018 pm 03:45 PM

這篇文章帶給大家的內容是關於node如何爬取網頁中的圖片（附程式碼），有一定的參考價值，有需要的朋友可以參考一下，希望對你有幫助。

const express = require(&#39;express&#39;);
const app = express();
app.get(&#39;/index&#39;, function(req, res) {
res.end(&#39;111&#39;)
})
var server = app.listen(8081, function() {
    var host = server.address().address
    var port = server.address().port
    console.log("应用实例，访问地址为 http://%s:%s", host, port)

})

登入後複製

運行node demo.js簡單的服務就搭起來了，如圖：

請求我們要爬取的頁面

npm install superagent
npm install superagent-charset
npm install cheerio

登入後複製

superagent 是用來發起請求的，是一個輕量的,漸進式的ajax api,可讀性好,學習曲線低,內部依賴nodejs原生的請求api,適用於nodejs環境下.，也可以使用http發起請求

superagent-charset防止爬取下來的資料亂碼，更改字元格式

cheerio為伺服器特別定制的，快速、靈活、實施的jQuery核心實作.。安裝完依賴就可以引入了

var superagent = require(&#39;superagent&#39;);
var charset = require(&#39;superagent-charset&#39;);
charset(superagent);
const cheerio = require(&#39;cheerio&#39;);

登入後複製

引入之後就請求我們的地址，https://www.qqtn.com/tx/weixintx_1.html，如圖：

######### ######宣告位址變數：###

const baseUrl = &#39;https://www.qqtn.com/&#39;

登入後複製

###這些設定完之後就是發請求了，接下來請看完整程式碼demo.js###

var superagent = require(&#39;superagent&#39;);
var charset = require(&#39;superagent-charset&#39;);
charset(superagent);
var express = require(&#39;express&#39;);
var baseUrl = &#39;https://www.qqtn.com/&#39;; //输入任何网址都可以
const cheerio = require(&#39;cheerio&#39;);
var app = express();
app.get(&#39;/index&#39;, function(req, res) {
    //设置请求头
    res.header("Access-Control-Allow-Origin", "*");
    res.header(&#39;Access-Control-Allow-Methods&#39;, &#39;PUT, GET, POST, DELETE, OPTIONS&#39;);
    res.header("Access-Control-Allow-Headers", "X-Requested-With");
    res.header(&#39;Access-Control-Allow-Headers&#39;, &#39;Content-Type&#39;);
    //类型
    var type = req.query.type;
    //页码
    var page = req.query.page;
    type = type || &#39;weixin&#39;;
    page = page || &#39;1&#39;;
    var route = `tx/${type}tx_${page}.html`
    //网页页面信息是gb2312，所以chaeset应该为.charset(&#39;gb2312&#39;)，一般网页则为utf-8,可以直接使用.charset(&#39;utf-8&#39;)
    superagent.get(baseUrl + route)
        .charset(&#39;gb2312&#39;)
        .end(function(err, sres) {
            var items = [];
            if (err) {
                console.log(&#39;ERR: &#39; + err);
                res.json({ code: 400, msg: err, sets: items });
                return;
            }
            var $ = cheerio.load(sres.text);
            $(&#39;div.g-main-bg ul.g-gxlist-imgbox li a&#39;).each(function(idx, element) {
                var $element = $(element);
                var $subElement = $element.find(&#39;img&#39;);
                var thumbImgSrc = $subElement.attr(&#39;src&#39;);
                items.push({
                    title: $(element).attr(&#39;title&#39;),
                    href: $element.attr(&#39;href&#39;),
                    thumbSrc: thumbImgSrc
                });
            });
            res.json({ code: 200, msg: "", data: items });
        });
});
var server = app.listen(8081, function() {

    var host = server.address().address
    var port = server.address().port

    console.log("应用实例，访问地址为 http://%s:%s", host, port)

})

登入後複製

###執行demo.js就會回傳我們拿到的數據，如圖：###############一個簡單的node爬蟲就完成了。 ######相關推薦：#########node爬蟲之gbk網頁中文亂碼解決方案_html/css_WEB-ITnose###############node下的http小爬蟲的範例程式碼分享#######

以上是node如何爬取網頁中的圖片（附程式碼）的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7861

Java教學

1649

CakePHP 教程

1404

Laravel 教程

1300

PHP教程

1242

Related knowledge

前端熱敏紙小票打印遇到亂碼問題怎麼辦？ Apr 04, 2025 pm 02:42 PM

前端熱敏紙小票打印的常見問題與解決方案在前端開發中，小票打印是一個常見的需求。然而，很多開發者在實...

神秘的JavaScript：它的作用以及為什麼重要 Apr 09, 2025 am 12:07 AM

JavaScript是現代Web開發的基石，它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發，極大地提升了用戶體驗和跨平台開發的靈活性。