Banyak projek memerlukan penukaran fail Excel kepada format PDF, sama ada menjana laporan, berkongsi data atau membuat dokumen. Pada mulanya, saya, seperti kebanyakan pembangun, fikir ini akan menjadi tugas automatik yang mudah. Walau bagaimanapun, perjalanan untuk mencari penyelesaian percuma dan boleh dipercayai penuh dengan cabaran: pengehadan, isu keserasian dan alatan komersial yang mahal.
Akhirnya, saya berjaya mengatasi kesukaran ini dan membina Penukar Excel ke PDF saya sendiri dan menjadikannya tersedia sebagai alat sumber terbuka kepada pembangun lain yang mungkin menghadapi dilema yang sama.
Hasil carian awal menunjukkan penyelesaian berbayar seperti Aspose.Cells, Syncfusion dan lain-lain. Walaupun mereka berkuasa, yuran lesen mereka tinggi, menjadikannya kos tinggi untuk projek kecil atau peribadi.
Penukar dalam talian percuma nampaknya merupakan pilihan yang baik, tetapi ia tidak sesuai untuk automasi. Alat ini selalunya mempunyai isu privasi (kerana fail dimuat naik ke pelayan pihak ketiga), had saiz fail dan tidak menyediakan API pengaturcaraan.
Saya juga meneroka perpustakaan sumber terbuka, tetapi kebanyakannya tidak mempunyai fungsi untuk menukar fail Excel kepada PDF. Malah perpustakaan yang mempunyai ciri ini selalunya tidak boleh dipercayai atau tidak menyokong format Microsoft Office moden.
Selepas beberapa minggu mencari, saya terjumpa satu cara untuk menggunakan LibreOffice dalam mod tanpa kepala. LibreOffice ialah suite pejabat sumber terbuka percuma yang boleh menukar berbilang format fail, termasuk Excel, kepada PDF. Apabila berjalan dalam mod tanpa kepala, ia beroperasi melalui baris arahan, menjadikannya sesuai untuk automasi.
Untuk memudahkan pembangun menggunakan, saya membina Pelayan HTTP berasaskan Go ringan yang bertindak sebagai API REST. Pelayan ini merangkum fungsi LibreOffice dan membenarkan mana-mana bahasa pengaturcaraan berinteraksi dengannya melalui permintaan HTTP.
Daripada bergantung pada direktori sementara sistem, saya memilih untuk menggunakan direktori ./tmp tersuai. Ini memastikan tingkah laku yang konsisten kerana direktori sementara sistem kadangkala mempunyai kebenaran yang tidak dapat diramalkan.
/convert
titik akhir untuk memuat naik fail Excel melalui permintaan POST. Anda boleh mendapatkan kod sumber di https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.
Projek ini juga menyediakan imej Docker: wteja/pdf-converter.
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
Memandangkan perkhidmatan itu terdedah melalui HTTP, anda boleh berinteraksi dengannya menggunakan mana-mana bahasa pengaturcaraan.
<code class="language-csharp">var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);</code>
<code class="language-javascript">const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);</code>
<code class="language-python">import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)</code>
<code class="language-go">package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }</code>
Disebabkan kebergantungan LibreOffice, saiz imej Docker ialah 2.67 GB. Walaupun saya menguji imej yang lebih kecil seperti Alpine, ia mengandungi versi lama LibreOffice yang tidak serasi dengan format Microsoft Office moden. Walaupun Debian menyediakan LibreOffice terkini, imej yang dihasilkan adalah lebih besar (kira-kira 3 GB).
Saiz imej yang lebih besar adalah pertukaran yang boleh diterima berbanding dengan kos penyelesaian komersial. Setelah disediakan, imej boleh digunakan semula dalam berbilang projek tanpa membayar yuran lesen tambahan.
Kekecewaan dalam mencari penukar Excel ke PDF yang percuma menyebabkan saya membina penyelesaian saya sendiri menggunakan LibreOffice dalam mod tanpa kepala. Walaupun ia tidak sempurna, ia percuma, boleh dipercayai dan fleksibel. Jika anda menghadapi cabaran yang sama, saya harap projek ini menjimatkan masa dan usaha anda.
Sila lihat projek di GitHub atau tarik imej Docker daripada Docker Hub. Sila beritahu saya cara ia berfungsi untuk anda, atau jika anda mempunyai cadangan untuk penambahbaikan.
Atas ialah kandungan terperinci Perjuangan Mencari Penukar Excel kepada PDF Percuma: Perjalanan dan Penyelesaian Saya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!