HTML 段落間隔に 2 つのスペースを追加する

PHPz
リリース: 2024-04-09 14:09:02
オリジナル
402 人が閲覧しました

このコードは、Web データをスクレイピングおよび解析し、データベースにインポートするために必要なライブラリをインポートするために使用できます。Python リクエスト ライブラリを使用して Web ページを取得します。 BeautifulSoup ライブラリを使用してページを解析し、必要なデータを抽出します。データベース接続を確立し、SQLite3 ライブラリを使用してテーブルを作成しました。抽出したデータをデータベース テーブルに書き込みます。変更をコミットし、データベース接続を閉じます。

HTML 段落间距加两格

Python と SQL を使用して Web データを収集および解析する

必須ライブラリをインポートする

import requests
from bs4 import BeautifulSoup
import sqlite3
ログイン後にコピー

リクエストと解析Web ページ

url = 'https://example.com/page/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
ログイン後にコピー

必要なデータを抽出します

find_all() メソッドと get_text() メソッドを使用して、ページから必要なデータを抽出します。

titles = soup.find_all('h1')
titles = [title.get_text() for title in titles]
ログイン後にコピー

データベース接続を確立する

conn = sqlite3.connect('database.db')
c = conn.cursor()
ログイン後にコピー

データをデータベースに書き込む

for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))
ログイン後にコピー

変更を送信して接続を閉じる

conn.commit()
conn.close()
ログイン後にコピー

実際的なケース

Use このコードは、Amazon のホームページから上位の商品タイトル データを取得し、SQLite データベースに保存します。以下はデモコードです:

import requests
from bs4 import BeautifulSoup
import sqlite3

url = 'https://amazon.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

titles = soup.find_all('h2', {'class': 'a-size-medium s-inline s-access-title'})
titles = [title.get_text().strip() for title in titles]

conn = sqlite3.connect('amazon_titles.db')
c = conn.cursor()
for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))

conn.commit()
conn.close()
ログイン後にコピー

以上がHTML 段落間隔に 2 つのスペースを追加するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート