许多项目都需要将Excel文件转换为PDF格式,无论是生成报表、共享数据还是创建文档。起初,我像许多开发者一样,认为这将是一个易于自动化的任务。然而,寻找免费可靠的解决方案的历程却充满挑战:各种限制、兼容性问题以及昂贵的商业工具。
最终,我克服了这些困难,构建了自己的Excel转PDF转换器,并将其作为开源工具提供给其他可能面临同样困境的开发者。
最初的搜索结果指向了Aspose.Cells、Syncfusion等付费解决方案。虽然它们功能强大,但许可证费用高昂,对于小型或个人项目来说成本过高。
免费的在线转换器似乎是一个不错的选择,但它们不适合自动化。这些工具通常存在隐私问题(因为文件上传到第三方服务器)、文件大小限制,并且不提供编程API。
我还探索了开源库,但大多数库缺乏将Excel文件转换为PDF的功能。即使是那些具备此功能的库,也往往不可靠或不支持现代Microsoft Office格式。
经过几周的搜索,我偶然发现了使用无头模式下的LibreOffice 的方法。LibreOffice是一个免费的开源办公套件,可以将多种文件格式(包括Excel)转换为PDF。在无头模式下运行时,它通过命令行操作,非常适合自动化。
为了方便开发者使用,我构建了一个轻量级的基于Go的HTTP服务器,充当REST API。该服务器封装了LibreOffice的功能,并允许任何编程语言通过HTTP请求与之交互。
我没有依赖系统的临时目录,而是选择使用自定义的./tmp目录。这确保了行为的一致性,因为系统临时目录有时权限不可预测。
/convert
端点上传Excel文件。您可以在https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7找到源代码。
该项目也提供Docker镜像:wteja/pdf-converter。
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
由于服务通过HTTP公开,您可以使用任何编程语言与之交互。
<code class="language-csharp">var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);</code>
<code class="language-javascript">const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);</code>
<code class="language-python">import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)</code>
<code class="language-go">package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }</code>
由于LibreOffice的依赖项,Docker镜像大小为2.67 GB。虽然我测试了Alpine等更小的镜像,但它们包含的是旧版本的LibreOffice,与现代Microsoft Office格式不兼容。Debian虽然提供了最新的LibreOffice,但生成的镜像更大(约3 GB)。
与商业解决方案的成本相比,较大的镜像大小是可以接受的权衡。设置完成后,该镜像可以在多个项目中重复使用,无需支付额外的许可证费用。
寻找免费的Excel转PDF转换器的挫折感促使我使用无头模式下的LibreOffice构建了自己的解决方案。虽然它并非完美无缺,但它是免费的、可靠的且灵活的。如果您面临同样的挑战,我希望这个项目能够为您节省时间和精力。
请在GitHub上查看该项目,或从Docker Hub拉取Docker镜像。请告诉我它对您的效果如何,或者您是否有改进建议。
以上是寻找免费的 Excel 到 PDF 转换器的斗争:我的旅程和解决方案的详细内容。更多信息请关注PHP中文网其他相关文章!