Rumah pembangunan bahagian belakang masalah PHP Cara menggunakan phppdf untuk menukar PDF kepada html (contoh kod)

Cara menggunakan phppdf untuk menukar PDF kepada html (contoh kod)

Apr 04, 2023 am 10:43 AM

Memandangkan teknologi Internet terus berkembang, orang ramai mempunyai keperluan yang lebih tinggi dan lebih tinggi untuk format fail. Sebagai contoh, banyak syarikat atau individu kini lebih suka menggunakan format HTML semasa memproses dokumen, kerana format HTML mempunyai kelebihan pengendalian yang mudah, persembahan visual dan kebolehoperasian rangkaian. Format PDF juga merupakan format dokumen yang digunakan secara meluas. Jadi, bagaimana untuk menukar dokumen dalam format PDF ke dalam format HTML? Artikel ini akan memperkenalkan kaedah yang dilaksanakan dalam bahasa PHP: menggunakan perpustakaan phppdf untuk menukar PDF kepada kod HTML.

1. Pengenalan kepada perpustakaan phppdf

Pustaka phppdf ialah perpustakaan PHP sumber terbuka yang digunakan untuk membaca dan menghuraikan fail PDF dan menukarnya kepada kod HTML atau fail teks. Kerana perpustakaan phppdf berkuasa, anda perlu memasang perpustakaan phppdf terlebih dahulu sebelum anda boleh menukar fail PDF.

2. Pasang pustaka phppdf

Cara paling mudah untuk memasang perpustakaan phppdf adalah dengan memasangnya melalui komposer Anda hanya perlu melaksanakan arahan berikut dalam direktori akar projek:

composer require smalot/pdfparser
Salin selepas log masuk

Selepas pemasangan, jika anda perlu menggunakan perpustakaan phppdf untuk menukar PDF kepada kod HTML, anda perlu merujuk ruang nama berikut dalam kod PHP:

use Smalot\PdfParser\Parser;
Salin selepas log masuk

3

Semasa pemasangan Selepas membina perpustakaan phppdf, kami boleh menggunakannya untuk menghuraikan fail PDF Berikut ialah kod sampel:

$parser = new Parser();
$pdf = $parser->parseFile('path/to/pdf/file');

$text = $pdf->getText();
// 获取PDF文本内容

$html = $pdf->toHtml();
// 获取HTML代码
Salin selepas log masuk

Dalam kod, kami mula-mula mencipta objek Parser untuk. menghuraikan fail PDF. Kemudian, kami memanggil kaedah parseFile untuk menghuraikan fail PDF Parameter kaedah ini ialah laluan fail PDF. Selepas menghuraikannya, kami boleh mendapatkan kandungan teks fail PDF melalui kaedah getText, atau mendapatkan kod HTML yang ditukar daripada fail PDF melalui kaedah toHtml.

4. Memproses kod HTML

Memandangkan pemformatan fail PDF adalah rumit, dan pemformatan format HTML agak mudah, pemprosesan kod HTML yang ditukar daripada PDF juga merupakan tugas penting. Berikut ialah beberapa kaedah untuk memproses kod HTML:

1 Padamkan teg berlebihan

Mungkin terdapat banyak teg berlebihan dalam fail PDF, seperti teg div yang tidak berguna, teg p kosong, dsb. Teg bukan sahaja menggunakan ruang pada halaman HTML, tetapi juga boleh menjejaskan pengalaman membaca. Oleh itu, apabila menggunakan PDF ke kod HTML, kita perlu memadamkan tag tidak berguna ini secara seragam.

Kod sampel:

$html = preg_replace('/<\/?div[^>]*>/', '', $html);
$html = preg_replace('/(<p[^>]*><\/p>)*\n/', '', $html);
Salin selepas log masuk

2. Laraskan reka letak

Susun atur dokumen PDF selalunya tidak teratur dan perlu dilaraskan. Sebagai contoh, anda perlu menambah beberapa helaian gaya CSS untuk mengawal saiz fon atau jarak baris tajuk.

Kod contoh:

$html = "<!DOCTYPE html>\n<html>\n<head>\n<style>
  h1,h2,h3,h4,h5,h6 {
    margin: 0;
    line-height: 1.6em;
    font-size: 1em;
  }\n
</style>\n</head>\n<body>\n" . $html . "</body>\n</html>";
Salin selepas log masuk

Dalam kod, kami menambahkan helaian gaya, yang melaraskan tajuk, mengalih keluar lekukan tajuk dan melaraskan saiz fon dan jarak baris.

5. Ringkasan

Artikel ini memperkenalkan proses penggunaan perpustakaan phppdf untuk menukar PDF kepada kod HTML, termasuk langkah-langkah memasang perpustakaan phppdf, menghurai fail PDF dan memproses kod HTML. Melalui artikel ini, saya percaya bahawa pembaca telah menguasai kaedah menggunakan perpustakaan phppdf untuk menukar PDF kepada kod HTML saya harap ia akan membantu pembaca dalam pembangunan projek sebenar.

Atas ialah kandungan terperinci Cara menggunakan phppdf untuk menukar PDF kepada html (contoh kod). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

OWASP Top 10 PHP: Huraikan dan mengurangkan kelemahan umum. OWASP Top 10 PHP: Huraikan dan mengurangkan kelemahan umum. Mar 26, 2025 pm 04:13 PM

Artikel ini membincangkan kelemahan OWASP 10 dalam strategi PHP dan mitigasi. Isu -isu utama termasuk suntikan, pengesahan yang rosak, dan XSS, dengan alat yang disyorkan untuk memantau dan mendapatkan aplikasi PHP.

PHP 8 JIT (Just-in-Time) Penyusunan: Bagaimana ia meningkatkan prestasi. PHP 8 JIT (Just-in-Time) Penyusunan: Bagaimana ia meningkatkan prestasi. Mar 25, 2025 am 10:37 AM

Kompilasi JIT Php 8 meningkatkan prestasi dengan menyusun kod yang sering dilaksanakan ke dalam kod mesin, memberi manfaat kepada aplikasi dengan pengiraan berat dan mengurangkan masa pelaksanaan.

PHP Secure File Muat naik: Mencegah kelemahan berkaitan fail. PHP Secure File Muat naik: Mencegah kelemahan berkaitan fail. Mar 26, 2025 pm 04:18 PM

Artikel ini membincangkan mendapatkan muat naik fail PHP untuk mengelakkan kelemahan seperti suntikan kod. Ia memberi tumpuan kepada pengesahan jenis fail, penyimpanan selamat, dan pengendalian ralat untuk meningkatkan keselamatan aplikasi.

Penyulitan PHP: Penyulitan simetri vs asimetrik. Penyulitan PHP: Penyulitan simetri vs asimetrik. Mar 25, 2025 pm 03:12 PM

Artikel ini membincangkan penyulitan simetri dan asimetrik dalam PHP, membandingkan kesesuaian, prestasi, dan perbezaan keselamatan mereka. Penyulitan simetri lebih cepat dan sesuai untuk data pukal, manakala asimetrik digunakan untuk pertukaran utama yang selamat.

Pengesahan PHP & amp; Kebenaran: Pelaksanaan selamat. Pengesahan PHP & amp; Kebenaran: Pelaksanaan selamat. Mar 25, 2025 pm 03:06 PM

Artikel ini membincangkan pelaksanaan pengesahan dan kebenaran yang mantap dalam PHP untuk mencegah akses yang tidak dibenarkan, memperincikan amalan terbaik dan mengesyorkan alat peningkatan keselamatan.

PHP CSRF Perlindungan: Bagaimana untuk mencegah serangan CSRF. PHP CSRF Perlindungan: Bagaimana untuk mencegah serangan CSRF. Mar 25, 2025 pm 03:05 PM

Artikel ini membincangkan strategi untuk mencegah serangan CSRF di PHP, termasuk menggunakan token CSRF, kuki tapak yang sama, dan pengurusan sesi yang betul.

PHP API Kadar Mengehadkan: Strategi Pelaksanaan. PHP API Kadar Mengehadkan: Strategi Pelaksanaan. Mar 26, 2025 pm 04:16 PM

Artikel ini membincangkan strategi untuk melaksanakan kadar API yang mengehadkan PHP, termasuk algoritma seperti baldi token dan baldi bocor, dan menggunakan perpustakaan seperti simfoni/kadar-limiter. Ia juga meliputi pemantauan, had kadar penyesuaian secara dinamik, dan tangan

Pengesahan Input PHP: Amalan Terbaik. Pengesahan Input PHP: Amalan Terbaik. Mar 26, 2025 pm 04:17 PM

Artikel membincangkan amalan terbaik untuk pengesahan input PHP untuk meningkatkan keselamatan, memberi tumpuan kepada teknik seperti menggunakan fungsi terbina dalam, pendekatan putih, dan pengesahan sisi pelayan.

See all articles