為什麼使用pdf檢視器開啟的pdf檔都顯示亂碼呢?

WBOY
發布: 2024-01-17 16:18:05
轉載
1215 人瀏覽過

為什麼使用pdf檢視器開啟的pdf檔都顯示亂碼呢?

pdf檢視器怎麼開啟的pdf檔都是亂碼呢?

我用的是CAJViewer

CAJViewer5.5_OCR v5.5.0 Build 4030

說明:帶OCR識別,帶多語言包,OCR識別支援中英文識別。大小:32.911 MB

1)局部文字辨識:直接使用caj瀏覽器的ocr

將列印檔案儲存為MDI格式,然後使用Microsoft Office Document Image開啟該檔案。在工具選單下選擇「使用OCR辨識文字」來辨識文字內容。完成識別後,在工具選單下選擇“將文字傳送到Word”,將整個PDF檔案的識別結果輸出到Word檔案中。

請注意:Microsoft Office Document Image可以非常精確地辨識和轉換中文、英文和表格內容。然而,它無法直接將圖形輸出到Word文件中,而是將文件中的所有圖形單獨形成獨立的圖片文件,並放置在同一資料夾中,資料夾名稱與原始文件相同。因此,您可以使用Snagit軟體開啟這些圖形文件,並將其複製並貼上到Word。 (需要注意的是,所有的識別軟體都無法很好地處理圖形識別問題,Microsoft Office Document Image的處理方法已經是目前解決這個問題的最佳方案之一。)

推薦快速方法:

在從CAJ文件中提取文字之前,需要進行以下準備:首先,請確保已安裝CAJ文件瀏覽器5.5和Office2003,並完全安裝Office工具Microsoft Office Document Imaging。安裝完成後,您將在印表機清單中看到Microsoft Office Document Image Writer印表機。透過Microsoft Office Document Image,您可以高度精確地識別和轉換中文、英文以及表格等文件內容。這些準備工作能夠確保您成功提取CAJ文件中的文字訊息。

CAJ檔案的識別:

(一)首先,從網路上下載CAJ格式的資料檔案儲存到本機硬碟上。

(二)然後,啟動CAJViewer瀏覽器程序,並在該程序中開啟剛才儲存的CAJ格式的檔案。瀏覽文件到最後一頁後,請勿關閉CAJ瀏覽器程式。

(三)在CAJ瀏覽器程式視窗中,選擇“檔案”→“列印”,並選擇印表機為Microsoft Office Document Image Writer印表機,勾選列印到檔案選項和確定列印頁數。

(四)儲存列印文件(*.prn)到適當位置。等待列印完成後,Microsoft Office Document Image 會自動開啟剛才儲存的列印檔案。

(五)在Microsoft Office Document Image視窗中,選擇「頁面」選單中的「選擇所有頁面」選單項,然後選擇「工具」選單中的「使用OCR識別文字」來提取文字。

(六)選擇“工具”下的 “將文字傳送到word”,最後將把整個CAJ檔案辨識輸出到word檔案中。

wps開啟word文檔亂碼怎麼修復工具

有時候開啟Word文件可能會看見文件變成了一堆亂碼。不用急,可以試著透過下面的兩個方法來挽救你的文件。

一、替換格式法 .heike123.com

就是把損壞的Word文件存為另一種格式。

1、開啟被損壞的文件點選“檔案/另存為”選單,在 “儲存類型”清單中,選擇“RTF格式”,然後點選“儲存”按鈕,並關閉word。

2、開啟剛才儲存的RTF格式文件,再次使用 “另存為”將文件重新儲存為“Word文件”,現在開啟這個word文件就可以發現文件已經被恢復過來了。

如果在轉換成rtf格式後檔案仍然不能被恢復,可以將檔案再次轉換為純文字格式(*.txt),再轉換回Word格式。當然在轉換為txt檔案的時候其圖片等資訊會遺失掉。

如何解決PDF轉換成word文件時出現亂碼

有的PDF檔案轉換成word文件時會出現亂碼,我用了很多轉換軟體,結果文字還是亂碼。為了解決這個問題,我用瞭如下的笨辦法:

1、雙擊開啟PDF文件,當然事先得下載並安裝好PDF轉換器

2、把PDF中文字轉換成可編輯的word文檔,方法是:(在開啟的PDF文件中)點選:文件-另存為,在「儲存類型」後選擇:「TXT文件(*.txt )”,在“儲存在”後選擇“桌面”,點“儲存”,開啟桌面上的txt文件(與PDF同名),選擇文本,複製,貼上到word文件中。

3、把PDF中的圖片複製到word文件中,方法是:(在開啟的PDF檔案中)點擊:工具-快照(如果圖片較大,請點擊第二行的「縮小」工具,到可以看到全圖為止),選取圖片(在圖片的左上角按住滑鼠的左鍵,向右下角拖,這時應該有個虛線框出現,放開滑鼠即可),在開啟的word文件中的適當位置貼上(Ctrl V)。

4、這時你可以編輯word文件中的文字到你想要的,當然其中的圖片只能設定格式不能編輯。

上述2也可以這樣:(在開啟的PDF檔案中),點選:工具-文字檢視器(PDF中的文字,已經是文字形式了),再右鍵點選“全選”-“複製”,到word中「貼上」即可。此法雖是一頁一頁的,但在word文檔中可跟原來的版式相似。再點擊:工具-文字檢視器(也可以重複點擊Alt 9)進入PDF閱讀器介面(或文字介面)。

線上PDF轉換成Word轉換器使用步驟:

第一步:上傳需要轉換的PDF文件,顯示你上傳的文件成功,點選產生word文檔;

第二步:等待伺服器處理;

第三步:下載word文件另存為自己的電腦上面。

以上是為什麼使用pdf檢視器開啟的pdf檔都顯示亂碼呢?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:docexcel.net
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板