So crawlen Sie Website-Bilder in NodeJS-js-Tutorial-php.cn

So crawlen Sie Website-Bilder in NodeJS

亚连

Freigeben： 2018-06-20 16:40:05

Original

2900 Leute haben es durchsucht

Ich werde Ihnen anhand eines Beispiels beibringen, wie Sie mit NodeJS Website-Bilder crawlen. Interessierte Freunde können es speichern.

Ich erkläre Ihnen die Funktion des Crawlens von Website-Bildern mit NodeJS anhand von Beispielen. Das Folgende ist der vollständige Inhalt:

Prinzip:

Crawler ist das offensichtlichste IO. Für intensive Anwendungsszenarien ist es offensichtlich, Knoten zu verwenden, was das Data Mining mit geringem E/A-Warteaufwand bequemer macht

Verwenden Sie das Express-Modul, um den Knotendienst zu erstellen

und verwenden Sie das Anforderungsmodul, um den HTML-Code der Zielseite abzurufen

Laden Sie das Cheerio-Modul herunter, um HTML-Code zu verarbeiten (Cheerio hat eine ähnliche Syntax wie jQuery, ist also einfach zu verwenden und bequem)

Umgebungskonfiguration:

npm install express request cheerio --save

Nach dem Login kopieren

(1)Verschiedene Module vorstellen

var http = require(&#39;http&#39;);
var request = require(&#39;request);
var cheerio = require(&#39;cheerio&#39;);
var fs = require(&#39;fs&#39;); //用来操作文件
var url = &#39;https://movie.douban.com/cinema/nowplaying/beijing/&#39; //定义要爬的页面

Nach dem Login kopieren

(2) Eine Anfrage senden

http.get(function(res){
  var html = &#39;&#39;;
  var titles = [];
  res.setEncoding(&#39;utf-8&#39;) //防止中文乱码
  res.on(&#39;data&#39;,function(chunk){
    html += chrunk;    //监听data事件 每次取一块数据
  })
  res.on(&#39;end&#39;,function(){
    var $ = cheerio.load(html);  //获取数据完成后，解析html
    //将获取的图片存到images文件夹中
    $(&#39;.mod-bd img&#39;).each(function(index, item){
      //获取图片属性
      var imgName = $(this).parent().next().text().trimg()
      var imgfile = imgName + &#39;.jpeg&#39;;
      var imgSrc = $(this).attr(&#39;src&#39;)
      //采用request模块，向服务器发起请求 获取图片资源
      request.head(imgSrc, function(error, res,body){
        if(error){
          console.log(&#39;失败了&#39;)
        }
      });
      //通过管道的方式用fs模块将图片写到本地的images文件下
      request(imgSrc).pipe.(fs.createWriteStream(&#39;./images/&#39; + imgfile));
    })
    
  })
})

Nach dem Login kopieren

Das Obige habe ich für alle zusammengestellt. Ich hoffe, dass es in Zukunft für alle hilfreich sein wird.

Verwandte Artikel:

So implementieren Sie eine Neuzuweisung mit js

So speichern Sie auf Leinwand generierte Bilder in js

So implementieren Sie die bidirektionale Bindung in js

Eine detaillierte Einführung in die praktischeren Funktionen von Webpack

So implementieren Sie ein Menü mit jQuery. Funktion zum Entfernen hinzufügen

So konfigurieren Sie ueditor mit nodejs+mongodb+vue

Das obige ist der detaillierte Inhalt vonSo crawlen Sie Website-Bilder in NodeJS. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!