HTML 段落間距加兩格

PHPz
發布: 2024-04-09 14:09:02
原創
383 人瀏覽過

此程式碼可用於匯入必備庫來刮取和解析 Web 數據,並將其匯入資料庫:使用 Python 請求庫取得 Web 頁面。使用 BeautifulSoup 庫解析頁面並提取所需資料。使用 SQLite3 庫建立資料庫連線並建立表格。將擷取的資料寫入資料庫表中。提交更改並關閉資料庫連線。

HTML 段落间距加两格

使用Python 和SQL 刮取和解析Web 資料

匯入必備庫

import requests
from bs4 import BeautifulSoup
import sqlite3
登入後複製

請求和解析Web 頁面

url = 'https://example.com/page/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
登入後複製

提取所需資料

使用find_all()get_text() 方法從頁面中提取所需資料。

titles = soup.find_all('h1')
titles = [title.get_text() for title in titles]
登入後複製

建立資料庫連線

conn = sqlite3.connect('database.db')
c = conn.cursor()
登入後複製

將資料寫入資料庫

for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))
登入後複製

提交變更並關閉連線

conn.commit()
conn.close()
登入後複製

實戰案例

#使用此程式碼刮取了Amazon 首頁的頂級產品標題數據,並將其儲存在SQLite 資料庫中。以下是演示程式碼:

import requests
from bs4 import BeautifulSoup
import sqlite3

url = 'https://amazon.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

titles = soup.find_all('h2', {'class': 'a-size-medium s-inline s-access-title'})
titles = [title.get_text().strip() for title in titles]

conn = sqlite3.connect('amazon_titles.db')
c = conn.cursor()
for title in titles:
    c.execute('INSERT INTO titles (title) VALUES (?)', (title,))

conn.commit()
conn.close()
登入後複製

以上是HTML 段落間距加兩格的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!