为什么使用pdf查看器打开的pdf文件都显示乱码呢?
为什么使用pdf查看器打开的pdf文件都显示乱码呢??
我用的是CAJViewer
CAJViewer5.5_OCR v5.5.0 Build 4030
说明:带OCR识别,带多语言包,OCR识别支持中英文识别。 大小:32.911 MB
1)局部文字识别:直接使用caj浏览器的ocr
将打印文件保存为MDI格式,然后使用Microsoft Office Document Image打开该文件。在工具菜单下选择“使用OCR识别文本”来识别文本内容。完成识别后,在工具菜单下选择“将文本发送到Word”,将整个PDF文件的识别结果输出到Word文件中。
请注意:Microsoft Office Document Image可以非常准确地识别和转换中文、英文和表格内容。然而,它无法直接将图形输出到Word文档中,而是将文件中的所有图形单独形成独立的图片文件,并放置在同一文件夹中,文件夹名称与原文件相同。因此,您可以使用Snagit软件打开这些图形文件,并将其复制粘贴到Word中。(需要注意的是,所有的识别软件都无法很好地处理图形识别问题,Microsoft Office Document Image的处理方法已经是目前解决这个问题的最佳方案之一。)
推荐快速方法:
在从CAJ文件中提取文本之前,需要进行以下准备工作:首先,确保已安装CAJ文件浏览器5.5和Office2003,并完全安装Office工具Microsoft Office Document Imaging。安装完成后,您将在打印机列表中看到Microsoft Office Document Image Writer打印机。借助Microsoft Office Document Image,您可以高度准确地识别和转换中文、英文以及表格等文件内容。这些准备工作能够确保您成功提取CAJ文件中的文本信息。
CAJ文件的识别:
(一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。
(二)然后,启动CAJViewer浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。浏览文件到最后一页后,不要关闭CAJ浏览器程序。
(三)在CAJ浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。
(四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。
(五)在Microsoft Office Document Image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用OCR识别文本”提取文本。
(六)选择“工具”下的 “将文本发送到word”,最后将把整个CAJ文件识别输出到word文件中。
wps打开word文档乱码怎么修复工具
有时候打开Word文档可能会看见文档变成了一堆乱码。不用着急,可以试着通过下面的两个方法来挽救你的文件。
一、替换格式法 .heike123.com
就是把损坏的Word文档存为另一种格式。
1、打开被损坏的文档单击“文件/另存为”菜单,在 “保存类型”列表中,选择“RTF格式”,然后单击“保存”按钮,并关闭word。
2、打开刚才保存的RTF格式文件,再次使用 “另存为”将文件重新保存为“Word文档”,现在打开这个word文件就可以发现文件已经被恢复过来了。
如果在转换成rtf格式后文件仍然不能被恢复,可以将文件再次转换为纯文本格式(*.txt),再转换回Word格式。当然在转换为txt文件的时候其图片等信息会丢失掉。
如何解决PDF转换成word文档时出现乱码
有的PDF文件转换成word文档时会出现乱码,我用了好多转换软件,结果文字还是乱码。为了解决这个问题,我用了如下的笨办法:
1、双击打开PDF文件,当然事先得下载并安装好PDF转换器
2、把PDF中文字转换成可编辑的word文档,方法是:(在打开的PDF文件中)点击:文件-另存为,在“保存类型”后选择:“TXT文件(*.txt)”,在“保存在”后选择“桌面”,点“保存”,打开桌面上的txt文档(与PDF同名),选择文本,复制,粘贴到word文档中。
3、把PDF中的图片复制到word文档中,方法是:(在打开的PDF文件中)点击:工具-快照(如果图片较大,请点击第二行的“缩小”工具,到可以看到全图为止),选中图片(在图片的左上角按住鼠标的左键,向右下角拖,这时应该有个虚线框出现,松开鼠标即可),在打开的word文档中的适当位置粘贴(Ctrl+V)。
4、这时你可以编辑word文档中的文字到你想要的,当然其中的图片只能设置格式不能进行编辑。
上述2也可以这样:(在打开的PDF文件中),点击:工具-文本查看器(PDF中的文字,已经是文本形式了),再右击“全选”-“复制”,到word中“粘贴”即可。此法虽是一页一页的,但在word文档中可跟原来的版式相似。再点击:工具-文本查看器(也可以反复点按Alt+9)进入PDF阅读器界面(或文本界面)。
在线PDF转换成Word转换器使用步骤:
第一步:上传需要转换的PDF文件,显示你上传的文件成功,点击生成word文档;
第二步:等待服务器处理;
第三步:下载word文档另存为自己的电脑上面。
以上是为什么使用pdf查看器打开的pdf文件都显示乱码呢?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

如果您怀疑自己的硬盘遇到问题,可以检查Windows 7上的错误。此php.cn帖子讨论了FixDisk Windows 7。您可以遵循该指南以检查Windows 7上的错误。

在Windows 10/11中安装了像NVIDIA驱动程序这样的图形驱动程序之后,您是否曾经遇到过黑屏?现在,在PHP.CN的这篇文章中,您可以找到一些值得尝试的NVIDIA驱动程序更新黑屏的解决方案。

如果您需要基于Windows 11 23H2的自定义LITE系统,则可以选择Windows X-Lite最佳11 23H2 HOME或OVERMIM 11 PRO。继续阅读,PHP.CN将向您展示如何下载最佳11 23H2 ISO并在PC上安装Pro或Home。

许多Surfacebook用户报告说,他们符合Windows 11/10上的“由EW_USBCCGPFILTER.SYS阻止的核心隔离”问题。 PHP.CN的这篇文章有助于解决烦人的问题。继续阅读。

提示和建议通知是Windows 11的新设计。它将为您提供有关某些新功能的建议和提示。但是你们中的一些人可能会被弹出窗口所困扰。您可以从php.cn阅读此帖子,以了解如何关闭技巧和建议

如果您有多个显示器,则必须熟悉Windows P快捷方式。但是,窗口P无法正常工作,可能会偶尔发生。如果您面临此问题,则PHP.CN的这篇文章确实可以为您提供帮助。

KB2267602是Windows Defender的保护或定义更新,旨在修复Windows中的漏洞和威胁。一些用户报告说他们无法安装KB2267602。这篇来自PHP.CN的帖子介绍了如何修复“ KB2267602 FAI

数据恢复始终是一个加热的话题。要成功地从设备恢复数据,您应该知道它如何存储数据。您可以从此PHP.CN帖子中学习RAID恢复和硬盘恢复之间的区别。
