Avec l'avènement de l'ère numérique, l'utilisation de documents électroniques est de plus en plus répandue et les fichiers PDF sont largement utilisés dans divers scénarios, tels que les articles académiques, les accords contractuels, les livres électroniques, etc. Cependant, dans certains cas, nous devons convertir les fichiers PDF au format image pour un traitement ou un affichage ultérieur. Cet article explique comment utiliser Golang pour convertir des fichiers PDF au format image.
Afin de réaliser la fonction de conversion de PDF en images, nous devons utiliser une bibliothèque tierce GoPdf. GoPdf est une bibliothèque de traitement de fichiers PDF dans le langage Go. Elle prend en charge la génération et l'édition de fichiers PDF, ainsi que la conversion de PDF en formats d'image. L'installation de GoPdf est très simple, il suffit de saisir la commande suivante dans le terminal :
go get github.com/signintech/gopdf/...
Une fois l'installation terminée, nous pouvons commencer à écrire des programmes pour convertir des fichiers PDF en images. Un exemple de programme est donné ci-dessous :
package main import ( "bufio" "flag" "fmt" "github.com/signintech/gopdf" "image" "image/jpeg" "image/png" "os" "path/filepath" "strings" ) var ( inputFile string // 输入的 PDF 文件名 outputFilePrefix string // 输出的图片文件名前缀 outputFormat string // 输出的图片格式 dpi int // 输出图片分辨率(DPI) ) func main() { flag.StringVar(&inputFile, "input", "", "Input PDF filename") flag.StringVar(&outputFilePrefix, "prefix", "", "Output image filename prefix") flag.StringVar(&outputFormat, "format", "png", "Output image format: png or jpeg") flag.IntVar(&dpi, "dpi", 72, "Output image resolution (DPI)") flag.Parse() if inputFile == "" { fmt.Println("Please specify input PDF filename using -input") return } if outputFilePrefix == "" { outputFilePrefix = strings.TrimSuffix(inputFile, filepath.Ext(inputFile)) } pdf, err := gopdf.Open(inputFile) if err != nil { fmt.Println("Failed to open PDF file:", err) return } defer pdf.Close() numPages := pdf.GetPageCount() if numPages == 0 { fmt.Println("PDF file contains no page") return } for i := 1; i <= numPages; i++ { page := pdf.GetPage(i) if page == nil { continue } defer page.Close() img := page.Render(dpi, dpi, nil) if img == nil { fmt.Println("Failed to render page", i) return } outputFile := fmt.Sprintf("%s_%d.%s", outputFilePrefix, i, outputFormat) file, err := os.Create(outputFile) if err != nil { fmt.Println("Failed to create output file:", err) return } defer file.Close() writer := bufio.NewWriter(file) if outputFormat == "png" { if err := png.Encode(writer, img); err != nil { fmt.Println("Failed to encode image:", err) return } } else { if err := jpeg.Encode(writer, img, &jpeg.Options{Quality: 95}); err != nil { fmt.Println("Failed to encode image:", err) return } } fmt.Println("Page", i, "saved to", outputFile) } fmt.Println("Done") }
Dans cet exemple de programme, nous spécifions le nom du fichier PDF d'entrée via le paramètre de ligne de commande -input
, et -prefix
spécifie la sortie image Préfixe du nom de fichier, -format
spécifie le format de l'image de sortie, -dpi
spécifie la résolution (DPI) de l'image de sortie. Si -prefix
n'est pas spécifié, la valeur par défaut consiste à utiliser le nom du fichier d'entrée moins l'extension comme préfixe. Le programme ouvre d'abord le fichier PDF d'entrée et obtient le nombre total de pages qu'il contient. Parcourez ensuite chaque page, affichez-la sous forme d'image et enregistrez-la dans le fichier de sortie. Le format d'image peut être PNG ou JPEG, qui sont codés respectivement en utilisant image/png
et image/jpeg
dans la bibliothèque standard Go. -input
指定输入的 PDF 文件名,-prefix
指定输出的图片文件名前缀,-format
指定输出的图片格式,-dpi
指定输出图片的分辨率(DPI)。如果没有指定 -prefix
,则默认使用输入文件名去掉扩展名作为前缀。程序首先打开输入的 PDF 文件,获取其中页面总数。然后遍历每一页,将其渲染为图片,并保存到输出文件中。图片格式可以选择 PNG 或 JPEG,分别使用 Go 标准库中的 image/png
和 image/jpeg
进行编码。
使用示例程序非常简单,只需要在终端中输入以下命令即可:
go run pdf2img.go -input input.pdf
其中 input.pdf
是要转换的 PDF 文件名。如果需要指定输出文件的前缀、格式或分辨率,可以加上相应的命令行参数,例如:
go run pdf2img.go -input input.pdf -prefix output -format jpeg -dpi 300
这将把 input.pdf
转换为 JPEG 格式的图片,分辨率为 300 DPI,并以 output_1.jpeg
、output_2.jpeg
、output_3.jpeg
等命名保存。
综上所述,使用 GoPdf 和 Go 标准库中的 image/png
和 image/jpeg
input.pdf
est le nom du fichier PDF à convertir. Si vous devez spécifier le préfixe, le format ou la résolution du fichier de sortie, vous pouvez ajouter les paramètres de ligne de commande correspondants, par exemple : 🎜rrreee🎜Cela convertira input.pdf
en une image au format JPEG avec une résolution de 300 DPI, et enregistrez avec des noms tels que output_1.jpeg
, output_2.jpeg
, output_3.jpeg
, etc. 🎜🎜Pour résumer, l'utilisation de GoPdf et image/png
et image/jpeg
dans la bibliothèque standard Go peut facilement convertir des fichiers PDF en formats d'image pour répondre à vos propres besoins de traitement PDF. 🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!