Java は、コードを記述することでさまざまなコンピューティングおよびデータ処理タスクを実行するために使用できる、広く使用されているプログラミング言語です。 Java では、さまざまな API 実装を使用して Word ドキュメントを HTML に変換できます。この記事では、Apache POI (Microsoft Office ファイルの読み取りおよび書き込み用の Java API) を使用して Word ドキュメントを HTML に変換することに焦点を当てます。
はじめに
Word ドキュメントを操作する場合、ドキュメントを HTML に変換することが一般的に必要になります。これにより、Web 上でのドキュメントの表示と共有が容易になります。 Java には、このタスクの達成に役立つライブラリが多数あります。 1 つの方法は、Apache POI API を使用することです。
Apache POI は、Microsoft Office ファイルの読み取りと書き込みに使用できるオープン ソースの Java API です。 XWPF (Word Document Processor) クラス ライブラリを使用して、Word ドキュメントを HTML に変換できます。
実装
まず、次の依存関係をプロジェクトに追加する必要があります:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.1.2</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml-schemas</artifactId> <version>4.1.2</version> </dependency> <dependency> <groupId>org.apache.xmlbeans</groupId> <artifactId>xmlbeans</artifactId> <version>3.1.0</version> </dependency>
次に、WordToHtmlConverter
という名前のクラスを作成します。このクラスには、Word ドキュメントへのパスをパラメータとする convertToHtml
メソッドがあります。このメソッドは、POI API 実装を使用して Word ドキュメントを HTML に変換します。
import java.io.*; import org.apache.poi.xwpf.converter.core.*; import org.apache.poi.xwpf.converter.xhtml.*; import org.apache.poi.xwpf.usermodel.*; public class WordToHtmlConverter { public void convertToHtml(String wordFilePath) { try { InputStream inputStream = new FileInputStream(new File(wordFilePath)); IXWPFConverter<HTMLSettings> converter = XWPFConverter.getInstance(); HTMLSettings htmlSettings = new HTMLSettings(); OutputStream outputStream = new FileOutputStream(new File("output.html")); converter.convert(new XWPFDocument(inputStream), outputStream, htmlSettings); } catch (Exception ex) { ex.printStackTrace(); } } }
この例では、まず Word 文書の入力ストリームを開き、次に IXWPPFonverter オブジェクトをインスタンス化します。また、変換の構成ファイルとして機能する HTMLSettings クラスも作成しました。最後に、結果を「output.html」というファイルに保存します。
このメソッドを使用する場合は、以下に示すように、Word ドキュメントへの絶対パスの文字列を convertToHtml
メソッドに渡すだけです。
以上がJavaでWord文書をHTMLに変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。