Apabila kami mereka bentuk halaman web, kami selalunya perlu menukar pelbagai format, seperti menukar daripada Word kepada format HTML, menukar daripada HTML kepada format Markdown, dsb. Penukaran HTML adalah salah satu keperluan biasa Artikel ini akan memperkenalkan cara menggunakan alat sedia ada untuk menukar HTML kepada format lain.
[Teks]
1. Tukar HTML kepada Markdown
Markdown ialah format teks yang ringkas, mudah dibaca dan ditulis. Ia merupakan salah satu format teks yang paling popular bahasa penulisan dokumen teknikal satu. Oleh itu, menukar HTML kepada Markdown adalah keperluan yang sering ditemui.
Terdapat banyak cara untuk mencapai ini. Berikut adalah kaedah yang agak mudah, yang memerlukan penggunaan alat pandoc.
pandoc ialah alat penukaran teks merentas platform yang menyokong penukaran daripada berbilang format kepada berbilang format. Alamat muat turun tapak web rasmi khusus: https://pandoc.org/installing.html
Buka alat baris arahan dan tukar ke lokasi fail HTML yang perlu ditukar.
pandoc -s input.html -o output.md
Arahan ini akan menukar semua fail HTML dalam direktori semasa kepada Markdown, dan nama fail output akan menjadi sama seperti fail asal, dengan akhiran Bernama .md.
for i in *.html; do pandoc -s "$i" -o "${i%.html}.md"; done
di mana input.html ialah nama fail yang perlu ditukar, dan output.tex ialah fail LaTeX output .
pandoc -s input.html -o output.tex
3 Tukar HTML kepada format lain
for i in *.html; do pandoc -s "$i" -o "${i%.html}.tex"; done
[Kesimpulan]
pandoc -s input.html -o output.pdf pandoc -s input.html -o output.docx pandoc -s input.html -o output.epub pandoc -s input.html -o output.odt
Atas ialah kandungan terperinci Bagaimana untuk menukar HTML kepada format lain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!