Bagaimanakah perpustakaan Python seperti urllib2 dan BeautifulSoup boleh digunakan untuk mengikis waktu matahari terbit dan terbenam secara pemrograman daripada tapak web?

Patricia Arquette
Lepaskan: 2024-10-26 23:07:30
asal
630 orang telah melayarinya

How can Python libraries like urllib2 and BeautifulSoup be used to programmatically scrape sunrise and sunset times from a website?

Pengikisan Web Terprogram dengan Python

Pengenalan: Pengikisan web, proses mengekstrak data daripada tapak web, ialah teknik yang berharga untuk analisis data dan automasi. Python menawarkan pelbagai modul yang memperkasakan pembangun untuk mengikis kandungan web dengan berkesan.

Mengikis Web dengan urllib2 dan BeautifulSoup

Untuk matlamat khusus anda untuk mendapatkan semula waktu matahari terbit/matahari terbenam daripada laman web, gabungan urllib2 dan perpustakaan BeautifulSoup adalah penyelesaian yang sesuai. Modul ini berfungsi seiring untuk mengambil dan menghuraikan kandungan web, membolehkan anda mengakses maklumat yang berkaitan.

Panduan Kod

Kod Python yang diberikan memberikan contoh yang berkesan tentang cara untuk menggunakan pendekatan ini:

<code class="python">import urllib2
from BeautifulSoup import BeautifulSoup

# Fetch the web page
response = urllib2.urlopen('http://example.com')

# Parse the HTML content
soup = BeautifulSoup(response.read())

# Identify the desired table and rows
table = soup('table', {'class': 'spad'})[0]
rows = table.tbody('tr')

# Extract and print the date, sunrise, and sunset information
for row in rows:
    tds = row('td')
    print(tds[0].string, tds[1].string)</code>
Salin selepas log masuk

Dalam kod ini:

  • urllib2.urlopen('http://example.com').read() mengambil kandungan HTML tapak web yang ditentukan.
  • BeautifulSoup(response.read()) menghuraikan kandungan HTML ke dalam objek berstruktur.
  • jadual = soup('table', {'class': 'spad'})[0] mencari jadual minat berdasarkan atribut kelasnya.
  • rows = table.tbody('tr ') memilih baris jadual di mana waktu matahari terbit/ terbenam.
  • print(tds[0].string, tds[1].string) mengekstrak dan mencetak tarikh dan waktu matahari terbit/ terbenam.

Sumber Tambahan

Untuk panduan lanjut, anda boleh rujuk tutorial berikut:

  • [Mengikis Web dengan Python Menggunakan Sup Cantik dan Permintaan](https://www.edureka.co/blog/web-scraping-with-python/)
  • [Mengikis web menggunakan Python](https:/ /www.geeksforgeeks.org/web-scraping-using-python/)

Atas ialah kandungan terperinci Bagaimanakah perpustakaan Python seperti urllib2 dan BeautifulSoup boleh digunakan untuk mengikis waktu matahari terbit dan terbenam secara pemrograman daripada tapak web?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!