ポイワードからHTMLへ

May 15, 2023 pm 09:58 PM

インターネットの発展に伴い、HTML はますます広く使用されるようになり、HTML 形式に変換する必要があるドキュメントが増えています。 POI Word は、Microsoft Word ドキュメントを読み取って操作できる Java のオープンソース ライブラリであるため、POI Word ドキュメントを HTML 形式に変換することが非常に必要です。

この記事では、POI Word を使用して Word 文書を HTML 形式に変換する方法を紹介します。

1. POI Word ライブラリをダウンロードします

まず、POI Word ライブラリをダウンロードする必要があります。POI ライブラリの最新バージョンは公式 Web サイトからダウンロードするか、次の URL からダウンロードできます。 Maven リポジトリ。

Maven ウェアハウスのアドレスは次のとおりです:

https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml/5.0.0

Afterダウンロードが完了したら、プロジェクトにインポートします。

2. Word ドキュメントのコンテンツを読み取る

POI Word を使用して Word ドキュメントを HTML 形式に変換するには、まず Word ドキュメントのコンテンツを読み取り、HTML ファイルを作成する必要があります。 。

コードは次のとおりです:

// 读取Word文档
XWPFDocument document = new XWPFDocument(new FileInputStream("test.docx"));

// 创建HTML文件
File file = new File("test.html");
FileOutputStream fos = new FileOutputStream(file);
ログイン後にコピー

3. HTML ファイル ヘッダーの作成

HTML ファイルでは、DOCTYPE タイプといくつかの必要なメタデータを定義する必要があります。

// 定义HTML头部
fos.write(("<!DOCTYPE html>
" +
        "<html>
" +
        "<head>
" +
        "<meta charset="UTF-8">
" +
        "<meta name="viewport" content="width=device-width, initial-scale=1.0">
" +
        "<title>Test</title>
" +
        "</head>
" +
        "<body>
").getBytes());
ログイン後にコピー

4. Word 文書のコンテンツを HTML 形式に変換する

Word 文書の各段落と各表を調べて、HTML 形式に変換する必要があります。

// 遍历每个段落
for (XWPFParagraph para : document.getParagraphs()){
    // 获取段落样式
    String style = para.getStyle();

    // 获取段落内容
    String text = para.getText();

    // 将段落转换为HTML格式
    String html = "<p style="" + style + "">" + text + "</p>
";

    // 写入HTML文件
    fos.write(html.getBytes());
}

// 遍历每个表格
for (XWPFTable table : document.getTables()){
    // 获取表格边框样式
    String border = table.getCTTbl().getTblPr().getTblBorders().getTop().getVal().toString();

    // 将表格转换为HTML格式
    String html = "<table style="border-collapse: collapse; border: 1px solid " + border + "">
";

    // 遍历表格中的每一行
    for (XWPFTableRow row : table.getRows()){
        html += "<tr>
";

        // 遍历每一列
        for (XWPFTableCell cell : row.getTableCells()){
            // 获取单元格内容
            String content = cell.getText();

            // 将单元格转换为HTML格式
            html += "<td>" + content + "</td>
";
        }

        html += "</tr>
";
    }

    html += "</table>
";

    // 写入HTML文件
    fos.write(html.getBytes());
}
ログイン後にコピー

5. HTML ファイルの末尾を作成します

最後に、HTML ファイルの末尾を作成する必要があります。コードは次のとおりです:

// 创建HTML尾部
fos.write(("</body>
</html>").getBytes());

// 关闭输出流
fos.close();
ログイン後にコピー

この時点で、Word ドキュメントは HTML 形式に正常に変換されました。

完全なコードは次のとおりです:

import org.apache.poi.xwpf.usermodel.*;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;

public class WordToHtml {
    public static void main(String[] args) throws IOException {
        // 读取Word文档
        XWPFDocument document = new XWPFDocument(new FileInputStream("test.docx"));

        // 创建HTML文件
        File file = new File("test.html");
        FileOutputStream fos = new FileOutputStream(file);

        // 创建HTML头部
        fos.write(("<!DOCTYPE html>
" +
                "<html>
" +
                "<head>
" +
                "<meta charset="UTF-8">
" +
                "<meta name="viewport" content="width=device-width, initial-scale=1.0">
" +
                "<title>Test</title>
" +
                "</head>
" +
                "<body>
").getBytes());

        // 遍历每个段落
        for (XWPFParagraph para : document.getParagraphs()){
            // 获取段落样式
            String style = para.getStyle();

            // 获取段落内容
            String text = para.getText();

            // 将段落转换为HTML格式
            String html = "<p style="" + style + "">" + text + "</p>
";

            // 写入HTML文件
            fos.write(html.getBytes());
        }

        // 遍历每个表格
        for (XWPFTable table : document.getTables()){
            // 获取表格边框样式
            String border = table.getCTTbl().getTblPr().getTblBorders().getTop().getVal().toString();

            // 将表格转换为HTML格式
            String html = "<table style="border-collapse: collapse; border: 1px solid " + border + "">
";

            // 遍历表格中的每一行
            for (XWPFTableRow row : table.getRows()){
                html += "<tr>
";

                // 遍历每一列
                for (XWPFTableCell cell : row.getTableCells()){
                    // 获取单元格内容
                    String content = cell.getText();

                    // 将单元格转换为HTML格式
                    html += "<td>" + content + "</td>
";
                }

                html += "</tr>
";
            }

            html += "</table>
";

            // 写入HTML文件
            fos.write(html.getBytes());
        }

        // 创建HTML尾部
        fos.write(("</body>
</html>").getBytes());

        // 关闭输出流
        fos.close();
    }
}
ログイン後にコピー

POI Word は DOCX 形式のドキュメントの読み取りのみをサポートしているため、ドキュメントを DOC 形式に変換する必要がある場合は、HWPFOldDocument クラスを使用する必要があります。

変換された HTML ファイルは、実際のニーズに応じて調整して書式設定する必要がある場合がありますが、この記事で説明する方法は、Word 文書を HTML 形式にすばやく変換し、作業効率を向上させるのに役立ちます。

以上がポイワードからHTMLへの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

UseEffectとは何ですか?副作用を実行するためにどのように使用しますか? UseEffectとは何ですか?副作用を実行するためにどのように使用しますか? Mar 19, 2025 pm 03:58 PM

この記事では、functionコンポーネントでのデータフェッチやDOM操作などの副作用を管理するためのフックであるReactの使用Effectについて説明します。メモリリークなどの問題を防ぐための使用、一般的な副作用、およびクリーンアップについて説明します。

怠zyなロードの概念を説明してください。 怠zyなロードの概念を説明してください。 Mar 13, 2025 pm 07:47 PM

怠zyな読み込みは、必要になるまでコンテンツの読み込みを遅延させ、初期負荷時間とサーバーの負荷を削減することにより、Webパフォーマンスとユーザーエクスペリエンスを改善します。

React和解アルゴリズムはどのように機能しますか? React和解アルゴリズムはどのように機能しますか? Mar 18, 2025 pm 01:58 PM

この記事では、Virtual DOMツリーを比較してDOMを効率的に更新するReactの調整アルゴリズムについて説明します。パフォーマンスの利点、最適化技術、ユーザーエクスペリエンスへの影響について説明します。

JavaScriptでカリーはどのように機能し、その利点は何ですか? JavaScriptでカリーはどのように機能し、その利点は何ですか? Mar 18, 2025 pm 01:45 PM

この記事では、JavaScriptのカレーについて説明します。これは、マルチアーグメント関数を単一argument関数シーケンスに変換する手法です。 Curryingの実装、部分的なアプリケーションなどの利点、実用的な用途、コード読み取りの強化を調査します

JavaScriptの高次関数とは何ですか?また、より簡潔で再利用可能なコードを書くためにどのように使用できますか? JavaScriptの高次関数とは何ですか?また、より簡潔で再利用可能なコードを書くためにどのように使用できますか? Mar 18, 2025 pm 01:44 PM

JavaScriptの高次関数は、抽象化、共通パターン、および最適化技術を通じて、コードの簡潔さ、再利用性、モジュール性、およびパフォーマンスを強化します。

usecontextとは何ですか?コンポーネント間で状態を共有するためにどのように使用しますか? usecontextとは何ですか?コンポーネント間で状態を共有するためにどのように使用しますか? Mar 19, 2025 pm 03:59 PM

この記事では、ReactのUseContextを説明しています。これにより、小道具掘削を避けることで国家管理を簡素化します。再レンダーの削減により、集中状態やパフォーマンスの改善などの利点について説明します。

connect()を使用して、ReactコンポーネントをReduxストアにどのように接続しますか? connect()を使用して、ReactコンポーネントをReduxストアにどのように接続しますか? Mar 21, 2025 pm 06:23 PM

記事では、Connect()、MapStateToprops、MapDispatchToprops、およびパフォーマンスへの影響を説明するReduxストアに反応コンポーネントをReduxストアに接続します。

イベントハンドラーのデフォルトの動作をどのように防止しますか? イベントハンドラーのデフォルトの動作をどのように防止しますか? Mar 19, 2025 pm 04:10 PM

記事では、PreventDefault()メソッドを使用して、イベントハンドラーのデフォルト動作の防止、ユーザーエクスペリエンスの強化などの利点、およびアクセシビリティの懸念などの潜在的な問題について説明します。

See all articles