


Die Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung
Viele Projekte erfordern die Konvertierung von Excel-Dateien in das PDF-Format, sei es beim Erstellen von Berichten, beim Teilen von Daten oder beim Erstellen von Dokumenten. Anfangs dachte ich, wie viele Entwickler, dass dies eine leicht automatisierbare Aufgabe sein würde. Der Weg zu einer kostenlosen und zuverlässigen Lösung ist jedoch mit Herausforderungen verbunden: Einschränkungen, Kompatibilitätsprobleme und teure kommerzielle Tools.
Schließlich habe ich diese Schwierigkeiten überwunden und meinen eigenen Excel-zu-PDF-Konverter erstellt und ihn als Open-Source-Tool anderen Entwicklern zur Verfügung gestellt, die möglicherweise vor dem gleichen Dilemma stehen.
Frustrierende Erfahrung
Business-Tools
Erste Suchergebnisse wiesen auf kostenpflichtige Lösungen wie Aspose.Cells, Syncfusion und andere hin. Obwohl sie leistungsstark sind, sind ihre Lizenzgebühren hoch, was sie für kleine oder persönliche Projekte unerschwinglich macht.
Online-Dienste
Kostenlose Online-Konverter scheinen eine gute Wahl zu sein, sind aber nicht für die Automatisierung geeignet. Diese Tools haben häufig Datenschutzprobleme (da Dateien auf Server von Drittanbietern hochgeladen werden), Dateigrößenbeschränkungen und bieten keine Programmier-APIs.
Open-Source-Bibliothek
Ich habe auch Open-Source-Bibliotheken ausprobiert, aber den meisten fehlte die Funktionalität zum Konvertieren von Excel-Dateien in PDF. Selbst Bibliotheken, die über diese Funktion verfügen, sind oft unzuverlässig oder unterstützen keine modernen Microsoft Office-Formate.
LibreOffice im Headless-Modus
Nach ein paar Wochen der Suche bin ich auf eine Möglichkeit gestoßen, LibreOffice im Headless-Modus zu verwenden. LibreOffice ist eine kostenlose Open-Source-Office-Suite, die mehrere Dateiformate, einschließlich Excel, in PDF konvertieren kann. Im Headless-Modus erfolgt die Bedienung über die Befehlszeile, was es ideal für die Automatisierung macht.
So funktioniert meine Lösung
Um Entwicklern die Verwendung zu erleichtern, habe ich einen leichten Go-basierten HTTP-Server erstellt, der als REST-API fungiert. Dieser Server kapselt die Funktionalität von LibreOffice und ermöglicht jeder Programmiersprache die Interaktion mit ihm über HTTP-Anfragen.
Hauptfunktionen
- Unterstützt mehrere Dateiformate: Unterstützt .xlsx, .xls, .csv, .docx, .pptx und andere Formate.
- Automatische Bereinigung: Temporäre Dateien werden nach einer Stunde automatisch gelöscht, um Speicherplatz zu sparen.
- Benutzerdefinierte Schriftarten: Benutzerdefinierte Schriftarten können durch Klonen des GitHub-Repositorys oder mithilfe eines Docker-Volumes installiert werden.
- Sprachübergreifende Integration: Funktioniert mit jeder Programmiersprache, die HTTP unterstützt.
Temporäre Verzeichnismethode
Anstatt mich auf das temporäre Verzeichnis des Systems zu verlassen, habe ich mich für die Verwendung eines benutzerdefinierten ./tmp-Verzeichnisses entschieden. Dies stellt ein konsistentes Verhalten sicher, da temporäre Systemverzeichnisse manchmal unvorhersehbare Berechtigungen haben.
Implementierungsdetails
Workflow
-
Datei-Upload: Der Client verwendet den
/convert
-Endpunkt, um Excel-Dateien über POST-Anfragen hochzuladen. - Temporärer Speicher: Der Server speichert Dateien im Verzeichnis ./tmp mit Dateinamen basierend auf Zeitstempeln.
- Konvertieren: Rufen Sie LibreOffice im Headless-Modus auf, um die Datei in PDF zu konvertieren und das Ergebnis im selben Verzeichnis zu speichern.
- Dateibereinigung: Goroutine im Hintergrund löscht Dateien, die älter als eine Stunde sind.
- Antwort: Geben Sie das konvertierte PDF als HTTP-Antwort zurück.
Erste Schritte
GitHub-Repository
Den Quellcode finden Sie unter https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.
Docker-Image
Dieses Projekt stellt auch ein Docker-Image bereit: wteja/pdf-converter.
Docker-Container ausführen
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
Beispiele für die Integration mit anderen Sprachen
Da der Dienst über HTTP verfügbar gemacht wird, können Sie mit jeder Programmiersprache mit ihm interagieren.
C#
var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);
Node.js
const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);
Python
import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)
Los
package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }
Herausforderungen und Kompromisse
Bildgröße
Aufgrund von LibreOffice-Abhängigkeiten beträgt die Docker-Image-Größe 2,67 GB. Obwohl ich kleinere Images wie Alpine getestet habe, enthielten sie ältere Versionen von LibreOffice, die nicht mit modernen Microsoft Office-Formaten kompatibel waren. Obwohl Debian das neueste LibreOffice bereitstellt, ist das generierte Image größer (ca. 3 GB).
Warum es sich lohnt
Die größere Bildgröße ist ein akzeptabler Kompromiss im Vergleich zu den Kosten kommerzieller Lösungen. Einmal eingerichtet, kann das Bild in mehreren Projekten wiederverwendet werden, ohne dass zusätzliche Lizenzgebühren anfallen.
Fazit
Die Frustration, einen kostenlosen Excel-zu-PDF-Konverter zu finden, veranlasste mich, meine eigene Lösung mit LibreOffice im Headless-Modus zu erstellen. Es ist zwar nicht perfekt, aber kostenlos, zuverlässig und flexibel. Wenn Sie vor der gleichen Herausforderung stehen, hoffe ich, dass Ihnen dieses Projekt Zeit und Mühe erspart.
Bitte schauen Sie sich das Projekt auf GitHub an oder laden Sie das Docker-Image von Docker Hub herunter. Bitte teilen Sie mir mit, wie es bei Ihnen funktioniert oder ob Sie Verbesserungsvorschläge haben.
Das obige ist der detaillierte Inhalt vonDie Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











Golang ist in Bezug auf Leistung und Skalierbarkeit besser als Python. 1) Golangs Kompilierungseigenschaften und effizientes Parallelitätsmodell machen es in hohen Parallelitätsszenarien gut ab. 2) Python wird als interpretierte Sprache langsam ausgeführt, kann aber die Leistung durch Tools wie Cython optimieren.

Golang ist in Gleichzeitigkeit besser als C, während C bei Rohgeschwindigkeit besser als Golang ist. 1) Golang erreicht durch Goroutine und Kanal eine effiziente Parallelität, die zum Umgang mit einer großen Anzahl von gleichzeitigen Aufgaben geeignet ist. 2) C über Compiler -Optimierung und Standardbibliothek bietet es eine hohe Leistung in der Nähe der Hardware, die für Anwendungen geeignet ist, die eine extreme Optimierung erfordern.

GoisidealforBeginersandSuitableforCloudandNetWorkServicesDuetoitsSimplicity, Effizienz und Konsumfeaturen.1) InstallgoFromTheofficialwebSiteAnDverifyWith'goversion'.2) CreateAneDrunyourFirstProgramwith'gorunhello.go.go.go.

Golang ist für schnelle Entwicklung und gleichzeitige Szenarien geeignet, und C ist für Szenarien geeignet, in denen extreme Leistung und Kontrolle auf niedriger Ebene erforderlich sind. 1) Golang verbessert die Leistung durch Müllsammlung und Parallelitätsmechanismen und eignet sich für die Entwicklung von Webdiensten mit hoher Konsequenz. 2) C erreicht die endgültige Leistung durch das manuelle Speicherverwaltung und die Compiler -Optimierung und eignet sich für eingebettete Systementwicklung.

Golang und Python haben jeweils ihre eigenen Vorteile: Golang ist für hohe Leistung und gleichzeitige Programmierung geeignet, während Python für Datenwissenschaft und Webentwicklung geeignet ist. Golang ist bekannt für sein Parallelitätsmodell und seine effiziente Leistung, während Python für sein Ökosystem für die kurze Syntax und sein reiches Bibliothek bekannt ist.

Die Leistungsunterschiede zwischen Golang und C spiegeln sich hauptsächlich in der Speicherverwaltung, der Kompilierungsoptimierung und der Laufzeiteffizienz wider. 1) Golangs Müllsammlung Mechanismus ist praktisch, kann jedoch die Leistung beeinflussen.

Golang und C haben jeweils ihre eigenen Vorteile bei Leistungswettbewerben: 1) Golang ist für eine hohe Parallelität und schnelle Entwicklung geeignet, und 2) C bietet eine höhere Leistung und eine feinkörnige Kontrolle. Die Auswahl sollte auf Projektanforderungen und Teamtechnologie -Stack basieren.

GolangissidealforbuildingsCalablesSystemduetoitseffizienz und Konsumverkehr, whilepythonexcelsinquickScriptingandDataanalyseduetoitssimplication und VacevastEcosystem.golangsDesineScouragesCouragescournations, tadelcodedeanDitsGoroutaTinoutgoroutaTinoutgoroutaTinoutsGoroutinesGoroutinesGoroutsGoroutins, t
