


Comment extraire des images haute résolution à partir de PDF à l'aide de Python sans modifier les dimensions ?
Oct 22, 2024 am 07:53 AMExtraire des images en résolution native à partir de PDF en Python sans rééchantillonnage
Extraire des images à partir de PDF avec leur résolution et format natifs tout en préservant la mise en page peut être un défi. Cependant, le module PyMuPDF de Python fournit une solution simple.
Utilisation de PyMuPDF
PyMuPDF peut générer des images sous forme de fichiers PNG, garantissant une haute résolution et conservant le format d'origine (par exemple, TIFF ,JPEG). Le code suivant démontre son utilisation :
<code class="python">import fitz doc = fitz.open("file.pdf") for i in range(len(doc)): for img in doc.getPageImageList(i): xref = img[0] pix = fitz.Pixmap(doc, xref) if pix.n < 5: # GRAY or RGB pix.writePNG("p%s-%s.png" % (i, xref)) else: # CMYK pix1 = fitz.Pixmap(fitz.csRGB, pix) pix1.writePNG("p%s-%s.png" % (i, xref)) pix1 = None pix = None</code>
Version modifiée pour fitz 1.19.6
Pour la dernière version de fitz (1.19.6), le code modifié suivant le code peut être utilisé :
<code class="python">import os import fitz from tqdm import tqdm workdir = "your_folder" for each_path in os.listdir(workdir): if ".pdf" in each_path: doc = fitz.Document((os.path.join(workdir, each_path))) for i in tqdm(range(len(doc)), desc="pages"): for img in tqdm(doc.get_page_images(i), desc="page_images"): xref = img[0] image = doc.extract_image(xref) pix = fitz.Pixmap(doc, xref) pix.save(os.path.join(workdir, "%s_p%s-%s.png" % (each_path[:-4], i, xref)))</code>
Ce code modifié utilise tqdm pour l'affichage de la barre de progression et optimise le processus d'extraction et d'enregistrement des images.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article chaud

Outils chauds Tags

Article chaud

Tags d'article chaud

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Comment utiliser la belle soupe pour analyser HTML?

Comment utiliser Python pour trouver la distribution ZIPF d'un fichier texte

Comment travailler avec des documents PDF à l'aide de Python

Comment se cacher en utilisant Redis dans les applications Django

Comment effectuer l'apprentissage en profondeur avec TensorFlow ou Pytorch?

Comment implémenter votre propre structure de données dans Python

Sérialisation et désérialisation des objets Python: partie 1
