ホームページ > ウェブフロントエンド > jsチュートリアル > ウィキペディア アカデミー賞リストの JavaScript スクレーパー。

ウィキペディア アカデミー賞リストの JavaScript スクレーパー。

Susan Sarandon
リリース: 2025-01-24 16:39:12
オリジナル
979 人が閲覧しました

このチュートリアルでは、JavaScriptのCheerio Libraryを使用してWebスクレイピングを示して、Wikipediaからアカデミー賞を受賞した映画を抽出し、CSVファイルに保存します。

最初に、必要なパッケージをインストールします:

WikipediaページURLは:
<code class="language-bash">npm install cheerio axios</code>
ログイン後にコピー
です

コードはconst url = 'https://en.wikipedia.org/wiki/List_of_Academy_Award%E2%80%93winning_films';

スクリプトはDOMをナビゲートし、テーブルセルからデータを抽出します。 axios

最後に、抽出されたデータがフォーマットされ、
<code class="language-javascript">const { data: html } = await axios.get(url);
const $ = cheerio.load(html);

const theadData = [];
const tableData = [];</code>
ログイン後にコピー
を使用してCSVファイルに保存されます。

<code class="language-javascript">$('tbody').each((i, column) => {
  const columnData = [];
  $(column).find('th').each((j, cell) => {
    columnData.push($(cell).text().replace('\n', ''));
  });
  theadData.push(columnData);
});

tableData.push(theadData[0]);

$('table tr').each((i, row) => {
  const rowData = [];
  $(row).find('td').each((j, cell) => {
    rowData.push($(cell).text().trim());
  });
  if (rowData.length) tableData.push(rowData);
});</code>
ログイン後にコピー
を使用してスクリプトを実行します

fs.writeFileSync結果の

ファイルには、スクレイプされたデータが含まれています。
<code class="language-javascript">const csvContent = tableData.map((row) => row.join(';')).join('\n');
fs.writeFileSync('academy_awards.csv', csvContent, 'utf-8');</code>
ログイン後にコピー

<code class="language-bash">node scraper.js</code>
ログイン後にコピー
このチュートリアルは、GoとPythonを使用した以前のスクレイピングチュートリアルに基づいています。 これが役立つ場合は、著者をサポートすることを検討してください:

academy_awards.csv

以上がウィキペディア アカデミー賞リストの JavaScript スクレーパー。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート