Gunakan Python dan WebDriver untuk menangkap halaman web dan menyimpannya sebagai fail PDF-tutorial php-php.cn

Rumah

pembangunan bahagian belakang

tutorial php

Gunakan Python dan WebDriver untuk menangkap halaman web dan menyimpannya sebagai fail PDF

王林

Jul 08, 2023 pm 10:55 PM

python capai fail pdf webdriver Tangkapan skrin halaman web

Gunakan Python dan WebDriver untuk mengambil tangkapan skrin halaman web dan menyimpannya sebagai fail PDF

Abstrak:
Dalam proses pembangunan dan ujian web, selalunya perlu untuk tangkapan skrin halaman web untuk analisis, rakaman dan pelaporan. Artikel ini akan memperkenalkan cara menggunakan Python dan WebDriver untuk mengambil tangkapan skrin halaman web dan menyimpan tangkapan skrin sebagai fail PDF untuk perkongsian dan pengarkiban yang mudah.

1. Pasang dan konfigurasikan Selenium WebDriver:

Pasang Python: Lawati tapak web rasmi Python (https://www.python.org/downloads/) untuk memuat turun dan memasang versi Python yang sesuai untuk sistem pengendalian anda.
Pasang Perpustakaan Selenium: Buka terminal atau baris arahan dan jalankan arahan berikut untuk memasang perpustakaan Selenium: pip install selenium
Pasang WebDriver: Pilih WebDriver yang sesuai mengikut penyemak imbas yang anda gunakan. Jika anda menggunakan penyemak imbas Chrome, anda boleh pergi ke tapak web rasmi ChromeDriver (https://sites.google.com/chromium.org/driver/) untuk memuat turun versi WebDriver yang sepadan dan menambahkannya pada pembolehubah persekitaran.

2. Tulis kod Python:
Berikut ialah contoh kod Python yang lengkap, menggunakan WebDriver untuk memintas halaman web URL yang ditentukan dan menyimpannya sebagai fail PDF.

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.chrome.options import Options
from selenium.common.exceptions import WebDriverException

# 设置Chrome浏览器选项
chrome_options = Options()
chrome_options.add_argument("--headless") # 无界面模式
chrome_options.add_argument("--disable-gpu") 

def save_webpage_as_pdf(url, save_path):
    try:
        # 创建浏览器实例
        driver = webdriver.Chrome(options=chrome_options)
        
        # 调整窗口大小以适应网页
        driver.set_window_size(1280, 800)
        
        # 访问网页
        driver.get(url)
        
        # 等待页面加载完成
        driver.implicitly_wait(5)
        
        # 获取网页高度
        total_height = driver.execute_script("return document.body.scrollHeight")
        
        # 将页面切成多个视口，每个视口高度为800
        viewports = int(total_height / 800) + 1
        
        # 初始化PDF打印选项
        driver.execute_script("document.body.style.webkitPrintColorAdjust='exact'")
        driver.execute_script("document.body.style.background='white'")
        driver.execute_script("window.scrollTo(0, 0)")
        
        # 逐个截取每个视口并保存为PDF
        for i in range(viewports):
            # 设置视口位置，每次向下滚动800像素
            driver.execute_script(f"window.scrollTo(0, {i * 800})")
            
            # 截图并保存为图片文件
            driver.save_screenshot(f"{save_path}_{i}.png")
        
        # 关闭浏览器
        driver.quit()
        
        # 使用Python库将截图合并为PDF
        from PIL import Image
        image_files = [f"{save_path}_{i}.png" for i in range(viewports)]
        images = [Image.open(img) for img in image_files]
        images[0].save(f"{save_path}.pdf", "PDF", save_all=True, append_images=images[1:])
        
        # 删除临时图片文件
        import os
        for img in image_files:
            os.remove(img)
            
        print(f"截图成功，并保存为PDF文件：{save_path}.pdf")
    
    except WebDriverException as e:
        print(f"截图失败：{e}")

# 调用截图函数
save_webpage_as_pdf("https://www.example.com", "example_webpage")

Salin selepas log masuk

3 Analisis kod:

Panggil kaedah webdriver.Chrome() untuk mencipta tika penyemak imbas Chrome dan gunakan parameter chrome_options untuk mengkonfigurasi mod tanpa antara muka . webdriver.Chrome()方法创建Chrome浏览器实例，并使用chrome_options参数配置无界面模式。
使用driver.set_window_size()方法设置浏览器窗口大小以适应网页。
使用driver.get()方法访问指定网址。
使用driver.save_screenshot()方法截取当前浏览器页面，并保存为图片文件。
使用PIL

driver.set_window_size()

Gunakan kaedah driver.get() untuk mengakses URL yang ditentukan.

Gunakan kaedah driver.save_screenshot() untuk menangkap halaman penyemak imbas semasa dan menyimpannya sebagai fail imej. 🎜🎜Gunakan pustaka PIL untuk menggabungkan tangkapan skrin ke dalam PDF. 🎜🎜🎜4 Ringkasan: 🎜Artikel ini memperkenalkan cara menggunakan Python dan WebDriver untuk mengambil tangkapan skrin halaman web dan menyimpan tangkapan skrin sebagai fail PDF. Melalui konfigurasi dan penggunaan WebDriver, kami boleh mengambil tangkapan skrin halaman web dengan mudah, dan menggunakan perpustakaan pemprosesan imej Python untuk menggabungkan berbilang tangkapan skrin ke dalam fail PDF, mencapai pemeliharaan lengkap dan perkongsian kandungan web. Kaedah ini boleh digunakan secara meluas dalam penyahpepijatan, merekod dan senario pelaporan semasa pembangunan dan ujian web untuk meningkatkan kecekapan dan ketepatan kerja. 🎜

Atas ialah kandungan terperinci Gunakan Python dan WebDriver untuk menangkap halaman web dan menyimpannya sebagai fail PDF. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7517

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Python vs C: Aplikasi dan kes penggunaan dibandingkan Apr 12, 2025 am 12:01 AM

Python sesuai untuk sains data, pembangunan web dan tugas automasi, manakala C sesuai untuk pengaturcaraan sistem, pembangunan permainan dan sistem tertanam. Python terkenal dengan kesederhanaan dan ekosistem yang kuat, manakala C dikenali dengan keupayaan kawalan dan keupayaan kawalan yang mendasari.

Apakah jenis fail yang terdiri daripada pangkalan data Oracle? Apr 11, 2025 pm 03:03 PM

Struktur fail pangkalan data Oracle termasuk: Fail Data: Menyimpan data sebenar. Fail Kawalan: Rekod maklumat struktur pangkalan data. Redo Fail Log: Rekod Operasi Transaksi Untuk Memastikan Konsistensi Data. Fail Parameter: Mengandungi Parameter Running Database untuk mengoptimumkan prestasi. Fail Log Arkib: Fail Log Redo Backup untuk Pemulihan Bencana.

Cara log masuk ke pangkalan data oracle Apr 11, 2025 pm 02:39 PM

Log masuk pangkalan data Oracle melibatkan bukan sahaja nama pengguna dan kata laluan, tetapi juga rentetan sambungan (termasuk maklumat pelayan dan kelayakan) dan kaedah pengesahan. Ia menyokong penyambung bahasa SQL*Plus dan pengaturcaraan dan menyediakan pilihan pengesahan seperti nama pengguna dan kata laluan, Kerberos dan LDAP. Kesalahan biasa termasuk ralat rentetan sambungan dan nama pengguna/kata laluan yang tidak sah, sementara amalan terbaik memberi tumpuan kepada penyatuan sambungan, pertanyaan parameter, pengindeksan, dan pengendalian kelayakan keselamatan.

Cara Menggunakan Log Debian Apache Untuk Meningkatkan Prestasi Laman Web Apr 12, 2025 pm 11:36 PM

Artikel ini akan menerangkan bagaimana untuk meningkatkan prestasi laman web dengan menganalisis log Apache di bawah sistem Debian. 1. Asas Analisis Log Apache Log merekodkan maklumat terperinci semua permintaan HTTP, termasuk alamat IP, timestamp, url permintaan, kaedah HTTP dan kod tindak balas. Dalam sistem Debian, log ini biasanya terletak di direktori/var/log/apache2/access.log dan /var/log/apache2/error.log. Memahami struktur log adalah langkah pertama dalam analisis yang berkesan. 2. Alat Analisis Log Anda boleh menggunakan pelbagai alat untuk menganalisis log Apache: Alat baris arahan: grep, awk, sed dan alat baris arahan lain.

Python: Permainan, GUI, dan banyak lagi Apr 13, 2025 am 12:14 AM

Python cemerlang dalam permainan dan pembangunan GUI. 1) Pembangunan permainan menggunakan pygame, menyediakan lukisan, audio dan fungsi lain, yang sesuai untuk membuat permainan 2D. 2) Pembangunan GUI boleh memilih tkinter atau pyqt. TKInter adalah mudah dan mudah digunakan, PYQT mempunyai fungsi yang kaya dan sesuai untuk pembangunan profesional.

Apakah pangkalan data Oracle dipasang pada cakera c? Apr 11, 2025 pm 04:21 PM

Tempat bersembunyi pangkalan data Oracle pada pemacu C: Pendaftaran: Gunakan editor pendaftaran untuk mencari "oracle" untuk mencari maklumat termasuk laluan pemasangan, nama perkhidmatan, dan lain -lain. Nama contoh. Tindakan yang teliti: Apabila menyahpasang Oracle, anda bukan sahaja perlu memadam fail, tetapi juga membersihkan pendaftaran dan perkhidmatan. Adalah disyorkan untuk menggunakan alat pemasangan rasmi atau mendapatkan bantuan profesional. Pengurusan Ruang: Mengoptimumkan ruang cakera untuk mengelakkan memasang Oracle pada pemacu C; Bersihkan fail sementara dengan kerap

Laravel (PHP) vs Python: Persekitaran Pembangunan dan Ekosistem Apr 12, 2025 am 12:10 AM

Perbandingan antara Laravel dan Python dalam persekitaran pembangunan dan ekosistem adalah seperti berikut: 1. Persekitaran pembangunan Laravel adalah mudah, hanya PHP dan komposer diperlukan. Ia menyediakan pelbagai pakej lanjutan seperti Laravelforge, tetapi penyelenggaraan pakej lanjutan mungkin tidak tepat pada masanya. 2. Persekitaran pembangunan Python juga mudah, hanya Python dan PIP diperlukan. Ekosistem adalah besar dan meliputi pelbagai bidang, tetapi pengurusan versi dan pergantungan mungkin kompleks.

PHP dan Python: Membandingkan dua bahasa pengaturcaraan yang popular Apr 14, 2025 am 12:13 AM

PHP dan Python masing -masing mempunyai kelebihan mereka sendiri, dan memilih mengikut keperluan projek. 1.PHP sesuai untuk pembangunan web, terutamanya untuk pembangunan pesat dan penyelenggaraan laman web. 2. Python sesuai untuk sains data, pembelajaran mesin dan kecerdasan buatan, dengan sintaks ringkas dan sesuai untuk pemula.

See all articles