Dengan perkembangan Internet, dokumen PDF telah menjadi format dokumen yang sangat popular dan penting serta telah digunakan secara meluas dalam pelbagai bidang. Pembacaan, penyuntingan dan pemprosesan dokumen PDF juga telah menjadi bahagian yang tidak dapat dielakkan dalam kerja banyak pembangun. Sebagai bahasa pengaturcaraan yang sangat popular, Java secara semulajadi menyediakan banyak teknik pemprosesan dokumen PDF yang berkuasa.
Artikel ini akan memperkenalkan secara ringkas teknik pemprosesan dokumen PDF menggunakan Java, termasuk:
Java menyediakan banyak kaedah untuk memproses dokumen PDF Terbuka perpustakaan sumber, seperti iText, PDFBox, Apache FOP, dsb. Melalui perpustakaan ini, kita boleh membaca kandungan dalam dokumen PDF dengan mudah, seperti teks, gambar, dsb.
Mengambil iText sebagai contoh, kita boleh membaca kandungan dokumen PDF melalui kod berikut:
PdfReader reader = new PdfReader("example.pdf"); String text = ""; for (int i = 1; i <= reader.getNumberOfPages(); i++) { text += PdfTextExtractor.getTextFromPage(reader, i); } reader.close(); System.out.println(text);
Baca keseluruhan kandungan dokumen PDF dan keluarkannya ke konsol.
Selain membaca kandungan dokumen PDF, kami juga boleh menggunakan Java untuk mengedit dokumen PDF, seperti menambah, mengubah suai, memadam teks atau gambar, dsb. tunggu.
Mengambil iText sebagai contoh, kita boleh menambah teks pada dokumen PDF melalui kod berikut:
String inputFile = "example.pdf"; String outputFile = "example-edited.pdf"; PdfReader reader = new PdfReader(inputFile); PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(outputFile)); PdfContentByte canvas = stamper.getOverContent(1); ColumnText.showTextAligned(canvas, Element.ALIGN_CENTER, new Phrase("Hello, World!"), 300, 650, 0); stamper.close(); reader.close();
Dalam contoh ini, kita mula-mula membaca dokumen PDF dan kemudian mencipta objek PdfStamper untuk diedit dokumen itu. Akhirnya mesej teks ditambahkan pada halaman pertama dokumen.
Kadangkala kita perlu menukar dokumen PDF kepada format lain, seperti imej, HTML, dsb. Java juga menyediakan banyak perpustakaan penukaran untuk melaksanakan fungsi ini.
Mengambil PDFBox sebagai contoh, kita boleh menukar halaman pertama dokumen PDF kepada gambar melalui kod berikut:
PDDocument document = PDDocument.load(new File("example.pdf")); PDPage page = document.getPage(0); BufferedImage image = page.convertToImage(BufferedImage.TYPE_INT_RGB, 300); ImageIO.write(image, "png", new File("example.png")); document.close();
Dalam contoh ini, kita mula-mula membaca dokumen PDF , dan kemudian dapatkan halaman pertama dokumen. Akhir sekali, halaman tersebut ditukar kepada imej melalui kaedah convertToImage() dan disimpan secara tempatan.
Kesimpulan
Melalui contoh di atas, kita dapat melihat bahawa Java menyediakan banyak teknik pemprosesan dokumen PDF yang berkuasa, terutamanya perpustakaan pihak ketiga seperti iText dan PDFBox, yang menjadikan pembacaan dokumen PDF Mengambil , pengeditan, penukaran dan operasi lain menjadi sangat mudah dan cekap. Saya harap artikel ini dapat membantu pembangun yang sedang membangunkan pemprosesan dokumen PDF.
Atas ialah kandungan terperinci Teknik pemprosesan dokumen PDF dilaksanakan menggunakan Java. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!