84669 人學習
152542 人學習
20005 人學習
5487 人學習
7821 人學習
359900 人學習
3350 人學習
180660 人學習
48569 人學習
18603 人學習
40936 人學習
1549 人學習
1183 人學習
32909 人學習
使用的指令是: pdftotext -enc UTF-8 test.pdf - 2>/dev/null
但输出为空,使用Adobe Reader打开可以正常保存为txt文件,就是使用pdftotext不行。
用windows版的pdftotext也不行。PDF的编码是Identity-H,请问有其它解决方案吗?
以下是转换失败的PDF:http://pan.baidu.com/s/1eQIFZO2
人生最曼妙的风景,竟是内心的淡定与从容!
感謝依雲的提點,問題已經解決了。
其實poppler對Identity-H的PDF是有BUG的,以下是BUG的描述:https://bugs.freedesktop.org/show_bug.cgi?id=35468
以下連結是補丁:http://cgit.freedesktop.org/poppler/poppler/commit/?id=018892d4ceccd5e2994cdb74cd2d401293fc929d
把補丁打上後重新編譯就可以正常轉換Identity-H編碼的PDF。
另外我在程式裡使用了-cfg參數,不過poppler 0.25已經不支援-cfg參數,需要去掉才行。
PS:此問題是基於joomla2.5的jifile元件產生的,所以要讓元件正常運作還需要修改程式碼。
感謝依雲的提點,問題已經解決了。
其實poppler對Identity-H的PDF是有BUG的,以下是BUG的描述:
https://bugs.freedesktop.org/show_bug.cgi?id=35468
以下連結是補丁:
http://cgit.freedesktop.org/poppler/poppler/commit/?id=018892d4ceccd5e2994cdb74cd2d401293fc929d
把補丁打上後重新編譯就可以正常轉換Identity-H編碼的PDF。
另外我在程式裡使用了-cfg參數,不過poppler 0.25已經不支援-cfg參數,需要去掉才行。
PS:此問題是基於joomla2.5的jifile元件產生的,所以要讓元件正常運作還需要修改程式碼。