Heim > Backend-Entwicklung > PHP-Tutorial > Beispiele für die Verwendung von Python zur Verarbeitung von MS Word

Beispiele für die Verwendung von Python zur Verarbeitung von MS Word

不言
Freigeben: 2023-03-25 16:38:01
Original
1818 Leute haben es durchsucht

Dieser Artikel stellt hauptsächlich Beispiele für die Verwendung von Python zur Verarbeitung von MS Word vor. Jetzt kann ich ihn mit Ihnen teilen.

Verwenden von Python-Tools zum Lesen und Schreiben von MS Word-Dateien (docx- und doc-Dateien), hauptsächlich unter Verwendung des Pakets python-docx. In diesem Artikel werden einige häufig verwendete Vorgänge beschrieben und ein Beispiel vervollständigt, um Ihnen den schnellen Einstieg zu erleichtern.

Installation

pyhton muss das python-docx-Paket verwenden, um docx-Dateien zu verarbeiten Das pip-Tool wird in Python im Ordner „Scripts“ unter dem Pfad

pip install python-docx
Nach dem Login kopieren

installiert. Natürlich können Sie auch easy_install oder manuelle Installation

<🎜 wählen >

Dateiinhalt schreiben

Hier geben wir direkt ein Beispiel und extrahieren nützliche Inhalte entsprechend Ihren eigenen Bedürfnissen

#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#打开文档
document = Document()
#加入不同等级的标题
document.add_heading(u&#39;MS WORD写入测试&#39;,0)
document.add_heading(u&#39;一级标题&#39;,1)
document.add_heading(u&#39;二级标题&#39;,2)
#添加文本
paragraph = document.add_paragraph(u&#39;我们在做文本测试!&#39;)
#设置字号
run = paragraph.add_run(u&#39;设置字号、&#39;)
run.font.size = Pt(24)
#设置字体
run = paragraph.add_run(&#39;Set Font,&#39;)
run.font.name = &#39;Consolas&#39;
#设置中文字体
run = paragraph.add_run(u&#39;设置中文字体、&#39;)
run.font.name=u&#39;宋体&#39;
r = run._element
r.rPr.rFonts.set(qn(&#39;w:eastAsia&#39;), u&#39;宋体&#39;)
#设置斜体
run = paragraph.add_run(u&#39;斜体、&#39;)
run.italic = True
#设置粗体
run = paragraph.add_run(u&#39;粗体&#39;).bold = True
#增加引用
document.add_paragraph(&#39;Intense quote&#39;, style=&#39;Intense Quote&#39;)
#增加无序列表
document.add_paragraph(
 u&#39;无序列表元素1&#39;, style=&#39;List Bullet&#39;
)
document.add_paragraph(
 u&#39;无序列表元素2&#39;, style=&#39;List Bullet&#39;
)
#增加有序列表
document.add_paragraph(
 u&#39;有序列表元素1&#39;, style=&#39;List Number&#39;
)
document.add_paragraph(
 u&#39;有序列表元素2&#39;, style=&#39;List Number&#39;
)
#增加图像(此处用到图像image.bmp,请自行添加脚本所在目录中)
document.add_picture(&#39;image.bmp&#39;, width=Inches(1.25))
#增加表格
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = &#39;Name&#39;
hdr_cells[1].text = &#39;Id&#39;
hdr_cells[2].text = &#39;Desc&#39;
#再增加3行表格元素
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = &#39;test&#39;+str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = &#39;desc&#39;+str(i)
#增加分页
document.add_page_break()
#保存文件
document.save(u&#39;测试.docx&#39;)
Nach dem Login kopieren

Der von diesem Code generierte Dokumentstil ist wie folgt

Hinweis: Es liegt ein Problem vor, dessen Lösung ich nicht gefunden habe lösen, also wie man die Grenzlinie für die Tabelle festlegt. Wenn Sie es wissen, geben Sie mir bitte einen Rat.

Dateiinhalt lesen

#coding=utf-8
from docx import Document
#打开文档
document = Document(u&#39;测试.docx&#39;)
#读取每段资料
l = [ paragraph.text.encode(&#39;gb2312&#39;) for paragraph in document.paragraphs];
#输出并观察结果,也可以通过其他手段处理文本即可
for i in l:
 print i
#读取表格材料,并输出结果
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode(&#39;gb2312&#39;),&#39;\t&#39;,
  print
 print &#39;\n&#39;
Nach dem Login kopieren

Wir verwenden immer noch die Datei, die wir gerade generiert haben, As Sie können sehen, dass das Ausgabeergebnis

Hinweis: Hier verwenden wir zum Lesen die GB2312-Codierung, hauptsächlich um das Lesen und Sicherstellen sicherzustellen schreibe Chinesisch richtig. Im Allgemeinen wird die UTF-8-Kodierung verwendet. Darüber hinaus kann es bei der Verarbeitung von docx-Dateien zu Problemen kommen. Wenn eine große Anzahl von doc-Dateien vorhanden ist, empfiehlt es sich, die doc-Dateien zunächst stapelweise in docx-Dateien zu konvertieren 🎜>Verwandte Empfehlungen:


Einführung in die Methode der Python-Verarbeitung Excel xlrd

Detaillierte Erläuterung von Beispielen für die Python-Verarbeitung von CSV-Dateien

Das obige ist der detaillierte Inhalt vonBeispiele für die Verwendung von Python zur Verarbeitung von MS Word. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage