Golang ialah bahasa pengaturcaraan cekap yang digunakan secara meluas dalam data besar, pengaturcaraan rangkaian, pengkomputeran awan dan bidang lain. Dalam medan ini, selalunya diperlukan untuk menukar dokumen Office ke dalam format HTML untuk paparan di Web atau operasi lain. Artikel ini akan memperkenalkan cara menggunakan Golang untuk melaksanakan fungsi Office to HTML.
1. Office to HTML
Dokumen pejabat biasanya termasuk format Word, Excel, PowerPoint dan lain-lain kaedah pengekodan dan struktur datanya, jadi ia memerlukan kaedah penukaran yang berbeza. Artikel ini hanya mengambil dokumen Word sebagai contoh untuk penjelasan.
Dokumen Word ialah struktur data yang kompleks, yang mengandungi fon, gaya, format, teks dan imej, dsb., jadi apabila menukar Terdapat banyak situasi yang perlu dikendalikan apabila menukar kepada format HTML.
Pertama, dokumen Word perlu dihuraikan ke dalam struktur DOM, dan kemudian ditukar kepada dokumen HTML mengikut peraturan DOM. Proses ini secara amnya memerlukan penggunaan perisian atau komponen seperti Microsoft Office Word, OpenOffice atau LibreOffice. Mengambil Microsoft Office Word sebagai contoh, anda boleh menggunakan komponen Office.Interop.Word untuk menghuraikan dokumen Word ke dalam struktur DOM, dan kemudian menukar struktur DOM ke dalam format HTML.
Dokumen Excel juga merupakan struktur data yang kompleks, yang merangkumi sel, baris, lajur, lembaran kerja, gaya, format, carta, dll. elemen. Oleh itu, pengekstrakan dan pemformatan data diperlukan apabila menukar kepada format HTML.
Anda boleh menggunakan komponen GoExcel untuk menghuraikan dokumen Excel ke dalam struktur, dan kemudian menulis dokumen HTML baris demi lajur mengikut data dalam struktur. Apabila menulis dokumen HTML, pemprosesan khas diperlukan berdasarkan penggabungan sel, gaya sel, dsb.
2. Golang melaksanakan penukaran Office kepada HTML
Di Golang, anda boleh menggunakan pustaka Go-ole untuk mengakses Microsoft Komponen Office Word. Menghuraikan dokumen Word ke dalam struktur DOM. Pustaka Go-ole menyediakan satu set antara muka API yang boleh mengakses dan mengendalikan objek COM. Anda boleh menggunakan kod berikut untuk membuka dokumen Word dan menghuraikannya ke dalam struktur DOM:
// 使用Go-ole库访问Microsoft Office Word组件 word, err := oleutil.CreateObject("Word.Application") if err != nil { panic(err) } defer word.Release() // 打开Word文档 doc, err := oleutil.CallMethod(word, "Documents", "Open", "path/to/word.docx") if err != nil { panic(err) } defer doc.Release() // 获取DOM结构 wordXML, err := oleutil.GetProperty(doc, "WordXML") if err != nil { panic(err) } defer wordXML.Clear()
Selepas menghuraikan ke dalam struktur DOM, anda boleh menggunakan perpustakaan goquery untuk menukar struktur DOM ke dalam format HTML dan menulisnya kepada fail. Pustaka goquery menyediakan satu set antara muka API yang boleh mengendalikan dan menukar struktur DOM. Anda boleh menggunakan kod berikut untuk menukar struktur DOM ke dalam format HTML:
// 将DOM结构转换成HTML文档 html := "" jqueryDoc, err := goquery.NewDocumentFromReader(strings.NewReader(wordXML.ToString())) if err == nil { jqueryDoc.Find("w\:document").Children().ChildrenFiltered("w\:body").Children().Each(func(i int, selection *goquery.Selection) { html += selection.Text() }) } // 将HTML文档写入文件 file, err := os.Create("path/to/word.html") if err != nil { panic(err) } defer file.Close() writer := bufio.NewWriter(file) _, err = writer.WriteString(html) if err != nil { panic(err) } writer.Flush()
Di Golang, anda boleh menggunakan perpustakaan GoExcel untuk mengakses dokumen Excel dan menghuraikan dokumen Excel ke dalam struktur. Pustaka GoExcel menyediakan satu set antara muka API yang boleh mengakses sel, baris, lajur, lembaran kerja dan elemen lain dokumen Excel. Anda boleh menggunakan kod berikut untuk membuka dokumen Excel dan menghuraikannya ke dalam struktur:
// 使用GoExcel库访问Excel文档 xls, err := excelize.OpenFile("path/to/excel.xlsx") if err != nil { panic(err) } // 获取第一个工作表中的所有行和列 rows, err := xls.GetRows("Sheet1") if err != nil { panic(err) } cols, err := xls.GetCols("Sheet1") if err != nil { panic(err) } // 将Excel文档解析成结构体 type Cell struct { Value string } type Row struct { Cells []Cell } type Excel struct { Rows []Row } var excel Excel for _, row := range rows { var r Row for _, cell := range row { r.Cells = append(r.Cells, Cell{Value: cell}) } excel.Rows = append(excel.Rows, r) }
Selepas menghuraikan ke dalam struktur, anda boleh menggunakan perpustakaan html/template untuk menulis struktur ke dalam dokumen HTML baris demi baris dan lajur demi lajur, dan kemudian tulis dokumen HTML Pemprosesan khas seperti penggabungan sel dan gaya sel dilakukan. Pustaka html/template menyediakan satu set antara muka API yang boleh menyebabkan pembolehubah dalam teks Go into HTML. Anda boleh menggunakan kod berikut untuk menukar dokumen Excel ke dalam format HTML:
// 将结构体渲染成HTML文本 html := "" t := template.New("excel.html") t, _ = t.Parse(`{{ define "table" }} <table> {{ range .Rows }} <tr> {{ range .Cells }} <td colspan="{{if gt .Count 1}}{{.Count}}{{else}}1{{end}}"> {{.Value}} </td> {{ end }} </tr> {{ end }} </table> {{ end }}`) t.ExecuteTemplate(&html, "table", struct { Rows []Row }{Rows: excel.Rows}) // 将HTML文本写入文件 file, err := os.Create("path/to/excel.html") if err != nil { panic(err) } defer file.Close() writer := bufio.NewWriter(file) _, err = writer.WriteString(html) if err != nil { panic(err) } writer.Flush()
3. Ringkasan
Dengan menggunakan Golang untuk melaksanakan fungsi Office kepada HTML, dokumen Office boleh ditukar dengan cepat dan cekap menjadi Format HTML. Dan lakukan paparan atau operasi lain di sebelah Web. Artikel ini mengambil dokumen Word dan dokumen Excel sebagai contoh untuk memperkenalkan proses lengkap cara Golang mengakses komponen Microsoft Office Word dan dokumen Excel serta melaksanakan penghuraian dan penukaran. Dalam aplikasi sebenar, pelarasan dan pengembangan yang sesuai boleh dibuat mengikut keperluan dan senario yang berbeza untuk memenuhi keperluan perniagaan dengan lebih baik.
Atas ialah kandungan terperinci pejabat golang ke html. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!