84669 person learning
152542 person learning
20005 person learning
5487 person learning
7821 person learning
359900 person learning
3350 person learning
180660 person learning
48569 person learning
18603 person learning
40936 person learning
1549 person learning
1183 person learning
32909 person learning
使用的指令是: pdftotext -enc UTF-8 test.pdf - 2>/dev/null
但输出为空,使用Adobe Reader打开可以正常保存为txt文件,就是使用pdftotext不行。
用windows版的pdftotext也不行。PDF的编码是Identity-H,请问有其它解决方案吗?
以下是转换失败的PDF:http://pan.baidu.com/s/1eQIFZO2
人生最曼妙的风景,竟是内心的淡定与从容!
感谢依云的提点,问题已经解决了。
其实poppler对Identity-H的PDF是有BUG的,以下是BUG的描述:https://bugs.freedesktop.org/show_bug.cgi?id=35468
以下链接是补丁:http://cgit.freedesktop.org/poppler/poppler/commit/?id=018892d4ceccd5e2994cdb74cd2d401293fc929d
把补丁打上后重新编译就可以正常转换Identity-H编码的PDF。
另外我在程序里使用了-cfg参数,不过poppler 0.25已经不支持-cfg参数,需要去掉才行。
PS:此问题是基于joomla2.5的jifile组件产生的,所以要使组件正常运作还需要修改代码。
感谢依云的提点,问题已经解决了。
其实poppler对Identity-H的PDF是有BUG的,以下是BUG的描述:
https://bugs.freedesktop.org/show_bug.cgi?id=35468
以下链接是补丁:
http://cgit.freedesktop.org/poppler/poppler/commit/?id=018892d4ceccd5e2994cdb74cd2d401293fc929d
把补丁打上后重新编译就可以正常转换Identity-H编码的PDF。
另外我在程序里使用了-cfg参数,不过poppler 0.25已经不支持-cfg参数,需要去掉才行。
PS:此问题是基于joomla2.5的jifile组件产生的,所以要使组件正常运作还需要修改代码。