Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법

Barbara Streisand
풀어 주다: 2024-10-22 07:50:03
원래의
956명이 탐색했습니다.

How to Extract Native Resolution Images from PDFs Using Python

Python의 PDF에서 기본 해상도 이미지 추출

PDF에서 정확한 이미지 추출을 위해서는 원본 해상도와 형식을 유지하는 것이 중요합니다. 이미지. PyMuPDF는 이 작업에 편리한 솔루션을 제공합니다.

시작하려면 PyMuPDF 모듈을 가져오고 대상 PDF 파일을 엽니다.

<code class="python">import fitz
doc = fitz.open("file.pdf")</code>
로그인 후 복사

getPageImageList를 사용하여 페이지를 반복하고 이미지를 추출합니다.

<code class="python">for i in range(len(doc)):
    for img in doc.getPageImageList(i):
        xref = img[0]
        pix = fitz.Pixmap(doc, xref)</code>
로그인 후 복사

이미지 유형에 따라 이미지를 PNG로 쓰거나 PNG로 쓰기 전에 CMYK 이미지를 RGB로 변환하세요.

<code class="python">if pix.n < 5:
            pix.writePNG("p%s-%s.png" % (i, xref))
else:               
            pix1 = fitz.Pixmap(fitz.csRGB, pix)
            pix1.writePNG("p%s-%s.png" % (i, xref))</code>
로그인 후 복사

탐색할 추가 리소스는 다음과 같습니다.

  • [PyMuPDF 이미지 추출 문서](https://pymupdf.readthedocs.io/en/latest/image-extraction.html)
  • [FitZ 1.19.6에 대한 향상된 FitZ 이미지 추출]( https://stackoverflow.com/a/74345380)

이 Python 솔루션을 사용하면 기본 해상도와 형식을 유지하면서 PDF에서 이미지를 효율적으로 추출하여 정확한 재생 및 분석을 보장할 수 있습니다.

위 내용은 Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!