コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ

バックエンド開発

Python チュートリアル

BeautifulSoupを使用してニューヨーク市のWebサイトから駐車券データを抽出する方法?

BeautifulSoupを使用してニューヨーク市のWebサイトから駐車券データを抽出する方法?

Patricia Arquette

Oct 27, 2024 am 12:57 AM

How to Extract Parking Ticket Data from a NYC Website with BeautifulSoup?

Python の BeautifulSoup を使用した HTML テーブルの解析

Web スクレイピングプロジェクトで作業する場合、HTML テーブルを効率的に解析する方法を知ることが不可欠です。人気の Python ライブラリである BeautifulSoup は、HTML ドキュメントからデータを抽出する強力な方法を提供します。この記事では、BeautifulSoup を使用したニューヨーク市の駐車券テーブルの解析という特定のシナリオを検討します。

問題:

Python のリクエストと BeautifulSoup ライブラリを学習するには、 ' は、単純なニューヨーク市の駐車券パーサーを作成する任務を負っています。指定された URL に移動して HTML 応答を取得した後、「lineItemsTable」HTML テーブルにリストされているすべての駐車チケットを抽出する必要があります。

テーブルの解析方法:

テーブルを解析する鍵は、BeautifulSoup のテーブル解析機能を利用することにあります。これを実現する改訂された Python コードスニペットは次のとおりです。

<code class="python">import requests
from bs4 import BeautifulSoup

plate = "T630134C"
plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}")
soup = BeautifulSoup(plateRequest.text, "html.parser")

table = soup.find("table", {"class": "lineItemsTable"})
table_body = table.find("tbody")

rows = table_body.find_all("tr")
data = []
for row in rows:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    data.append([col for col in cols if col])</code>

ログイン後にコピー

追加メモ:

抽出されたデータの最後の行には、「支払額」が含まれています。ラベルはテーブルの一部ではありません。行の長さが 7 未満かどうかを確認することで、これを除外できます。
各行の最後の列は、特別な処理が必要な入力テキストボックスです。

次のようにします。この手順を実行すると、BeautifulSoup を使用してニューヨーク市の駐車券テーブルを効果的に解析し、プロジェクトに必要な情報をすべて抽出できます。

以上がBeautifulSoupを使用してニューヨーク市のWebサイトから駐車券データを抽出する方法?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

もっと見る

人気の記事

R.E.P.O.説明されたエネルギー結晶と彼らが何をするか（黄色のクリスタル）

2週間前 By 尊渡假赌尊渡假赌尊渡假赌

レポ：チームメイトを復活させる方法

4週間前 By 尊渡假赌尊渡假赌尊渡假赌

ハローキティアイランドアドベンチャー：巨大な種を手に入れる方法

3週間前 By 尊渡假赌尊渡假赌尊渡假赌

スプリットフィクションを打ち負かすのにどれくらい時間がかかりますか？

3週間前 By DDD

R.E.P.O.ファイルの保存場所：それはどこにあり、それを保護する方法は？

3週間前 By DDD

もっと見る

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

もっと見る

ホットトピック

Gmailメールのログイン入り口はどこですか？

7315

9

Java チュートリアル

1625

14

CakePHP チュートリアル

1348

46

Laravel チュートリアル

1261

25

PHP チュートリアル

1208

29

もっと見る

Related knowledge

Pythonを使用してテキストファイルのZIPF配布を見つける方法

Pythonを使用してテキストファイルのZIPF配布を見つける方法 Mar 05, 2025 am 09:58 AM

Pythonを使用してテキストファイルのZIPF配布を見つける方法

Pythonでファイルをダウンロードする方法

Pythonでファイルをダウンロードする方法 Mar 01, 2025 am 10:03 AM

Pythonでファイルをダウンロードする方法

Pythonでの画像フィルタリング

Pythonでの画像フィルタリング Mar 03, 2025 am 09:44 AM

Pythonでの画像フィルタリング

HTMLを解析するために美しいスープを使用するにはどうすればよいですか？

HTMLを解析するために美しいスープを使用するにはどうすればよいですか？ Mar 10, 2025 pm 06:54 PM

HTMLを解析するために美しいスープを使用するにはどうすればよいですか？

Pythonを使用してPDFドキュメントの操作方法

Pythonを使用してPDFドキュメントの操作方法 Mar 02, 2025 am 09:54 AM

Pythonを使用してPDFドキュメントの操作方法

DjangoアプリケーションでRedisを使用してキャッシュする方法

DjangoアプリケーションでRedisを使用してキャッシュする方法 Mar 02, 2025 am 10:10 AM

DjangoアプリケーションでRedisを使用してキャッシュする方法

Natural Language Toolkit（NLTK）の紹介

Natural Language Toolkit（NLTK）の紹介 Mar 01, 2025 am 10:05 AM

Natural Language Toolkit（NLTK）の紹介

TensorflowまたはPytorchで深い学習を実行する方法は？

TensorflowまたはPytorchで深い学習を実行する方法は？ Mar 10, 2025 pm 06:52 PM

TensorflowまたはPytorchで深い学習を実行する方法は？

See all articles