首頁 > Java > java教程 > Java如何讀取Word批註中的文字與圖片

Java如何讀取Word批註中的文字與圖片

angryTom
發布: 2019-11-28 13:34:44
轉載
2982 人瀏覽過

本文將介紹讀取Word批註的方法,包括讀取Word批註中的文字及圖片。下面將透過Java程式碼來示範如何讀取批註。

Java如何讀取Word批註中的文字與圖片

工具使用:Word類別庫(Free Spire.Doc for Java 免費版)

Jar文件取得:可透過官網下載,下載後解壓縮文件,並將lib資料夾下的Spire.Doc.jar檔案匯入java程式;也可以透過Maven倉庫安裝導入。 ,具體路徑配置及導入方法可以參考教學https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html。

(建議學習:Java影片教學#)  

測試文件如下:批註中包含文字與圖片

【範例1】讀取註解中的文字

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.Comment;
import com.spire.doc.fields.TextRange;

public class ReadComment {
    public static void main(String[] args) {
        //加载测试文档
        Document doc = new Document();
        doc.loadFromFile("sample.docx");

        //实例化String类型变量
        String text = "";

        //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i);
            //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j);
                //遍历段落中的对象
                for (Object object : paragraph.getChildObjects()) {
                    //读取文本
                    if (object instanceof TextRange) {
                        TextRange textRange = (TextRange) object;
                        text = text + textRange.getText();
                    }
                }
            }
        }
        //输入文本内容
        System.out.println(text);
    }
}
登入後複製

批次文字讀取結果:

 【範例2】讀取註解中的圖片

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;
import com.spire.doc.fields.Comment;
import com.spire.doc.fields.DocPicture;

import javax.imageio.ImageIO;
import java.awt.image.RenderedImage;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;


public class ExtractImgsInComment {
    public static void main(String[] args) throws IOException{
        //加载测试文档
        Document doc = new Document();
        doc.loadFromFile("sample.docx");

        //创建ArrayList数组对象
        ArrayList images = new ArrayList();

        //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i);
            //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j);
                //遍历段落中的对象
                for (Object object : paragraph.getChildObjects()) {
                    //获取图片对象
                    if(object instanceof DocPicture){
                        DocPicture picture = (DocPicture) object;
                        images.add(picture.getImage());
                    }
                }
            }
        }
        //提取图片,并指定图片格式
        for (int z = 0; z< images.size(); z++) {
            File file = new File(String.format("图片-%d.png", z));
            ImageIO.write((RenderedImage) images.get(z), "PNG", file);
        }
    }
}
登入後複製

註解圖片讀取結果:

本文來自php中文網,java教學欄目,歡迎學習!   

以上是Java如何讀取Word批註中的文字與圖片的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:cnblogs.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板