Cherio を使用して Node.js で単純な Web クローラーを作成する (詳細なチュートリアル)

亚连
リリース: 2018-06-02 14:30:03
オリジナル
3335 人が閲覧しました

この記事では主に、cheerio を使用して簡単な Web クローラーのサンプルを作成する Node.js を紹介します。

この記事では、Cheerio を使用して簡単な Web クローラーのサンプルを作成する Node.js を紹介します。これには次の機能があります:

1. Web サイトのタイトル情報の取得を完了する

  1. 取得した情報を新しいファイルに出力

  2. ツール:cheerio、npmをダウンロードしてnpm install Cheerio

  3. cheerioのAPIの使い方は基本的にjQueryの使い方と同じです

  4. 習熟している方ならjQuery を使用すると、cheerio がすぐに開始されます

  5. 2. コード部分

  6. 導入: セグメント障害ページのリスト タイトルを取得し、最後に取得したタイトル リスト番号を pageTitle.txt ファイルに出力します
const https = require('https');
const fs = require('fs');
const cheerio = require('cheerio');
const url = 'https://segmentfault.com/';

https.get(url, (res) => {
  let html = '';
  res.on('data', (data) => {
    html += data;
  });
  res.on('end', () => {
    getPageTitle(html);
  });
}).on('error', () => {
  console.log('获取网页信息错误');
});

function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $('.news__item-title');
  let data = [];
  let index = 0;
  let fileName = 'pageTitle.txt';
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find(&#39;a&#39;).text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, &#39;utf8&#39;, (err) => {
    if (err) {
      console.log(&#39;fs文件系统创建新文件失败&#39;, err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}
ログイン後にコピー

上記は私が皆さんのためにまとめたものです。将来的に使用されることを願っています。皆さんのお役に立てれば幸いです。

関連記事:

JSアニメーションライブラリVelocity.jsの使い方について話そう

vue toggle クリック切り替えクラスを作る(例付きで解説)

Vue2.0 タブタブとページにスタイルを追加トランジションの切り替え方法

以上がCherio を使用して Node.js で単純な Web クローラーを作成する (詳細なチュートリアル)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!