這篇文章主要介紹了關於Ubuntu下使用python讀取doc和docx文檔的內容方法,有著一定的參考價值,現在分享給大家,有需要的朋友可以參考一下
##讀取docx文件
使用的套件是python-docx1. 安裝python-docx套件sudo pip install python-docx
#encoding:utf8 import docx doc = docx.Document('test.docx') docText = '\n'.join([paragraph.text for paragraph in doc.paragraphs]) #print(docText)
讀取doc文件
1. 到網站下載antiword。#encoding:utf8 import subprocess word = 'test.doc' output = subprocess.check_output(['antiword',word]) print(output)
##相關推薦:
以上是Ubuntu下使用python讀取doc和docx文件的內容方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!