Semasa proses pembangunan perisian, kami selalunya perlu menukar teks atau bahasa penanda kepada format lain, seperti menukar teks md kepada dokumen perkataan, untuk berkongsi atau memaparkan hasil kerja kami dengan lebih baik dengan pelanggan atau rakan kongsi. Dalam artikel ini, kami akan memperkenalkan cara menggunakan Golang untuk menukar teks md kepada dokumen perkataan melalui perpustakaan pandoc.
1. Gambaran keseluruhan pandoc
Pandoc ialah penukar teks sumber terbuka percuma yang boleh menukar fail teks dan bahasa markup kepada pelbagai format, seperti HTML, EPUB, LaTeX, PDF dan Microsoft Dokumen perkataan. Pandoc menyokong hampir semua bahasa markup, termasuk Markdown, reStructuredText, HTML, LaTeX, DocBook, MediaWiki, TWiki dan Textile. Pandoc menyokong gaya dan templat tersuai serta menyediakan banyak pilihan untuk mengawal output.
2. Pasang Pandoc dan Go
Sebelum kita mula menggunakan Pandoc dan Go, kita perlu memasangnya terlebih dahulu. Langkah-langkah untuk memasang Pandoc adalah seperti berikut:
Untuk memasang Go:
3. Pasang pandocfilters
pandocfilters ialah perpustakaan Python yang membolehkan anda menulis penapis Pandoc. Di Golang, kita boleh menggunakan Python sebagai penapis Pandoc dan memanggilnya melalui arahan pandoc untuk melengkapkan penukaran teks. Langkah-langkah untuk memasang pandocfilters adalah seperti berikut:
pip3 install pandocfilters
4. Tulis program Golang
Kami akan menggunakan Golang untuk menulis program untuk menukar teks md kepada dokumen perkataan. Program ini terbahagi kepada dua bahagian: penapis Pandoc dan program Golang.
Masukkan arahan berikut dalam terminal atau tetingkap baris arahan:
nano pandocfilters/md_to_docx.py
Kemudian tampal kod Python berikut:
#!/usr/bin/env python3 import sys import panflute as pf from pandocfilters import toJSONFilter def action(elem, doc): if isinstance(elem, pf.CodeBlock) and 'csljson' in elem.classes: return pf.RawBlock(elem.text, format='latex') if isinstance(elem, pf.Para) and len(elem.content) == 1 and isinstance(elem.content[0], pf.RawInline): return pf.RawBlock(elem.content[0].text, format='latex') if isinstance(elem, pf.Str) and len(elem.text) == 1 and ord(elem.text) > 126: return pf.RawInline(r'unicode{%04X}' % ord(elem.text), format='latex') if isinstance(elem, pf.Str) and len(elem.text) > 1 and all(ord(c) <= 126 for c in elem.text): return pf.RawInline(elem.text, format='latex') if isinstance(elem, pf.Image) and elem.url.startswith('data:'): return pf.Para(pf.Ide
Simpan dan tutup fail.
Masukkan arahan berikut dalam tetingkap terminal atau baris arahan:
nano md_to_docx.go
Kemudian tampal kod Golang berikut:
package main import ( "bytes" "io/ioutil" "os/exec" ) func main() { // 读取Markdown文件 data, err := ioutil.ReadFile("test.md") if err != nil { panic(err) } // 调用Pandoc过滤器转换Markdown为LaTeX cmd := exec.Command("pandoc", "--filter", "pandocfilters/md_to_docx.py", "-f", "markdown", "-t", "latex") cmd.Stdin = bytes.NewReader(data) out, err := cmd.Output() if err != nil { panic(err) } // 调用Pandoc将LaTeX转换为Word文档 cmd = exec.Command("pandoc", "-f", "latex", "-t", "docx", "--lua-filter=/Users/username/pandocfilters/lua/uncite.lua") cmd.Stdin = bytes.NewReader(out) out, err = cmd.Output() if err != nil { panic(err) } // 将结果保存为Word文档 err = ioutil.WriteFile("test.docx", out, 0644) if err != nil { panic(err) } }
Simpan dan tutup fail.
5. Gunakan program Golang untuk menukar md kepada perkataan
Masukkan arahan berikut dalam tetingkap terminal atau baris arahan:
go run md_to_docx.go
Atur cara akan membaca test.md dalam fail direktori semasa dan tukarkannya kepada fail test.docx.
6. Ringkasan
Dalam artikel ini, kami memperkenalkan cara menggunakan Golang dan Pandoc untuk menukar teks Markdown kepada dokumen Word. Kami menggunakan penapis Pandoc untuk menukar Markdown kepada LaTeX, dan kemudian menggunakan Pandoc untuk menukar dokumen LaTeX kepada Word. Kami juga membincangkan cara menggunakan penapis Python dan Pandoc untuk penapisan teks. Dengan cara ini, kita boleh menggunakan Golang untuk memanggil skrip Python untuk penukaran teks. Kami juga membincangkan cara memasang pustaka Pandoc, Go dan pandocfilters serta menyepadukannya ke dalam penyelesaian yang lengkap.
Atas ialah kandungan terperinci golang md to word. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!