Dalam kerja harian kami, kami selalunya perlu menukar dokumen Word ke dalam format HTML supaya ia boleh dipaparkan pada halaman web, atau dikongsi dan dihantar melalui e-mel. Dalam kes ini, kita boleh menggunakan perpustakaan POI untuk mencapai penukaran dokumen Word.
POI (Pelaksanaan Obfuscation Lemah) ialah perpustakaan Java untuk memproses fail dalam format Microsoft Office, termasuk dokumen Word (.doc dan .docx), hamparan Excel, persembahan PowerPoint, dsb. Ia adalah projek sumber terbuka Yayasan Perisian Apache dan menyediakan satu siri API yang boleh digunakan untuk membaca, menulis dan mengendalikan fail Office ini.
Seterusnya, kami akan mengambil penukaran dokumen Word ke dalam format HTML sebagai contoh untuk memperkenalkan cara menggunakan POI untuk melaksanakan fungsi ini.
Pertama, kita perlu menambah kebergantungan berikut dalam fail pom.xml projek:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.1.0</version> </dependency>
Seterusnya, kita perlu menulis kod Java untuk melaksanakan proses menukar dokumen Word ke dalam format HTML. Andaikan bahawa kami sudah mempunyai dokumen Word bernama "example.docx", yang akan kami gunakan dalam coretan kod berikut. Untuk penggunaan perpustakaan POI, sila rujuk ulasan.
import java.io.*; import org.apache.poi.xwpf.converter.core.*; import org.apache.poi.xwpf.converter.html.*; import org.apache.poi.xwpf.usermodel.*; public class Word2Html { public static void main(String[] args) { String inputFile = "example.docx"; String outputFile = "example.html"; try (InputStream inputStream = new FileInputStream(inputFile); XWPFDocument document = new XWPFDocument(inputStream); OutputStream outputStream = new FileOutputStream(outputFile)) { //创建HTML配置 HtmlConverterConfiguration configuration = HtmlConverterConfiguration .builder() .build(); //创建HTML转换器 AbstractHtmlConverter converter = HtmlConverter .getInstance() .getConverter(document, outputStream, configuration); //进行转换 converter.convert(); System.out.println("转换完成!"); } catch (IOException e) { e.printStackTrace(); } } }
Inti kod di atas ialah menggunakan kelas HtmlConverter
untuk mendapatkan penukar HTML AbstractHtmlConverter
dan memanggil kaedah convert()
nya untuk penukaran. Kami juga boleh menetapkan parameter penukaran, seperti kualiti pemampatan imej, gaya CSS, dsb., dengan mengkonfigurasi objek HtmlConverterConfiguration
.
Selepas menjalankan kod di atas, fail bernama "example.html" akan dijana dalam direktori akar projek, yang mengandungi kandungan dokumen Word yang baru kami tukar. Kami boleh membukanya dengan mana-mana editor atau penyemak imbas yang menyokong format HTML dan melihat kesan yang ditukar.
Secara umumnya, proses menggunakan perpustakaan POI untuk menukar dokumen Word ke dalam format HTML tidaklah rumit. Dengan cara ini, kami boleh menukar secara langsung kandungan dokumen ke dalam bentuk halaman web, yang memudahkan perkongsian dan penghantaran, di samping meningkatkan kebolehbacaan dan interaktiviti.
Atas ialah kandungan terperinci poi word转html. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!