Viele Projekte erfordern die Konvertierung von Excel-Dateien in das PDF-Format, sei es beim Erstellen von Berichten, beim Teilen von Daten oder beim Erstellen von Dokumenten. Anfangs dachte ich, wie viele Entwickler, dass dies eine leicht automatisierbare Aufgabe sein würde. Der Weg zu einer kostenlosen und zuverlässigen Lösung ist jedoch mit Herausforderungen verbunden: Einschränkungen, Kompatibilitätsprobleme und teure kommerzielle Tools.
Schließlich habe ich diese Schwierigkeiten überwunden und meinen eigenen Excel-zu-PDF-Konverter erstellt und ihn als Open-Source-Tool anderen Entwicklern zur Verfügung gestellt, die möglicherweise vor dem gleichen Dilemma stehen.
Erste Suchergebnisse wiesen auf kostenpflichtige Lösungen wie Aspose.Cells, Syncfusion und andere hin. Obwohl sie leistungsstark sind, sind ihre Lizenzgebühren hoch, was sie für kleine oder persönliche Projekte unerschwinglich macht.
Kostenlose Online-Konverter scheinen eine gute Wahl zu sein, sind aber nicht für die Automatisierung geeignet. Diese Tools haben häufig Datenschutzprobleme (da Dateien auf Server von Drittanbietern hochgeladen werden), Dateigrößenbeschränkungen und bieten keine Programmier-APIs.
Ich habe auch Open-Source-Bibliotheken ausprobiert, aber den meisten fehlte die Funktionalität zum Konvertieren von Excel-Dateien in PDF. Selbst Bibliotheken, die über diese Funktion verfügen, sind oft unzuverlässig oder unterstützen keine modernen Microsoft Office-Formate.
Nach ein paar Wochen der Suche bin ich auf eine Möglichkeit gestoßen, LibreOffice im Headless-Modus zu verwenden. LibreOffice ist eine kostenlose Open-Source-Office-Suite, die mehrere Dateiformate, einschließlich Excel, in PDF konvertieren kann. Im Headless-Modus erfolgt die Bedienung über die Befehlszeile, was es ideal für die Automatisierung macht.
Um Entwicklern die Verwendung zu erleichtern, habe ich einen leichten Go-basierten HTTP-Server erstellt, der als REST-API fungiert. Dieser Server kapselt die Funktionalität von LibreOffice und ermöglicht jeder Programmiersprache die Interaktion mit ihm über HTTP-Anfragen.
Anstatt mich auf das temporäre Verzeichnis des Systems zu verlassen, habe ich mich für die Verwendung eines benutzerdefinierten ./tmp-Verzeichnisses entschieden. Dies stellt ein konsistentes Verhalten sicher, da temporäre Systemverzeichnisse manchmal unvorhersehbare Berechtigungen haben.
/convert
-Endpunkt, um Excel-Dateien über POST-Anfragen hochzuladen. Den Quellcode finden Sie unter https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.
Dieses Projekt stellt auch ein Docker-Image bereit: wteja/pdf-converter.
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
Da der Dienst über HTTP verfügbar gemacht wird, können Sie mit jeder Programmiersprache mit ihm interagieren.
<code class="language-csharp">var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);</code>
<code class="language-javascript">const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);</code>
<code class="language-python">import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)</code>
<code class="language-go">package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }</code>
Aufgrund von LibreOffice-Abhängigkeiten beträgt die Docker-Image-Größe 2,67 GB. Obwohl ich kleinere Images wie Alpine getestet habe, enthielten sie ältere Versionen von LibreOffice, die nicht mit modernen Microsoft Office-Formaten kompatibel waren. Obwohl Debian das neueste LibreOffice bereitstellt, ist das generierte Image größer (ca. 3 GB).
Die größere Bildgröße ist ein akzeptabler Kompromiss im Vergleich zu den Kosten kommerzieller Lösungen. Einmal eingerichtet, kann das Bild in mehreren Projekten wiederverwendet werden, ohne dass zusätzliche Lizenzgebühren anfallen.
Die Frustration, einen kostenlosen Excel-zu-PDF-Konverter zu finden, veranlasste mich, meine eigene Lösung mit LibreOffice im Headless-Modus zu erstellen. Es ist zwar nicht perfekt, aber kostenlos, zuverlässig und flexibel. Wenn Sie vor der gleichen Herausforderung stehen, hoffe ich, dass Ihnen dieses Projekt Zeit und Mühe erspart.
Bitte schauen Sie sich das Projekt auf GitHub an oder laden Sie das Docker-Image von Docker Hub herunter. Bitte teilen Sie mir mit, wie es bei Ihnen funktioniert oder ob Sie Verbesserungsvorschläge haben.
Das obige ist der detaillierte Inhalt vonDie Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!