Maison développement back-end Tutoriel Python Comment diviser des documents PDF à l'aide du module PyPDF2 en Python

Comment diviser des documents PDF à l'aide du module PyPDF2 en Python

May 09, 2023 pm 03:34 PM
python pdf pypdf2

Installer le module PyPDF2

# Ce module est strictement sensible à la casse, y est en minuscule et le reste est en majuscule

pip3 install PyPDF2
Copier après la connexion

Comment diviser des documents PDF à laide du module PyPDF2 en Python

Une fois l'installation terminée, créez un dossier spécifiquement pour ce projet sur le serveur local disque dur, me voici Le chemin de stockage actuel est F:PythonPyPDF2 Il y a un dossier Python sur le lecteur F et un dossier nommé d'après ce module y est créé pour le stocker séparément et le distinguer des autres projets.

Créer des fichiers et préparer des documents PDF

Comment diviser des documents PDF à laide du module PyPDF2 en Python

Trouver un document PDF relativement volumineux pour m'entraîner. J'ai téléchargé son document sur le site officiel de Django. Ce document est assez volumineux, avec plus de 1900 pages, ce qui est largement suffisant. pour vous entraîner. Si nécessaire, allez sur le site officiel pour télécharger, ou répondez directement « pdf » à mon compte officiel pour obtenir le lien de téléchargement, puis créez un fichier de projet PDFCF.py.

Commencez à écrire

Le programme commence par deux lignes. Écrivez les deux phrases ci-dessus et ci-dessous. La première phrase signifie spécifier le programme en cours d'exécution de ce fichier. cela reste à voir. Cela ne sort pas, mais si vous savez exécuter rapidement des programmes par lots, vous connaîtrez sa fonction, je n'entrerai donc pas dans les détails ici.

#! python# PDFCF.py - pdf文件拆分程序
Copier après la connexion

L'idée du fractionnement du document

Le nombre de parties en lesquelles il est divisé n'est pas fixé, mais le nombre de pages composé de chaque partie est fixé, puis il calcule dynamiquement le nombre de parties divisées. . L'idée du fractionnement est désormais disponible. L'étape suivante consiste à lister la formule de calcul.

拆分的份数= 文档总页数 / 拆份每个pdf组成的页数
Copier après la connexion

Par exemple :

Si nous voulons diviser un document pdf avec un total de 35 pages et former un nouveau document toutes les 10 pages, alors la formule de calcul du nombre de parties en lesquelles il peut être divisé est comme suit :

3.5 = 35 / 10
Copier après la connexion

A ce moment, tout le monde fait attention Si la division est incomplète, le reste est de 0,5. Qu'est-ce que cela signifie ? En utilisant cet exemple, cela signifie qu'il reste 5 pages après la division en 3 parties. Dans ce cas, quel que soit le reste, vous devez avancer de 1 pour terminer la division complète du document. les 3 premiers documents Chaque document est composé de 10 pages, et le quatrième document est constitué des 5 dernières pages. S'il est divisible, le résultat est directement le nombre de copies fractionnées.

Formule de calcul de fractionnement Python :

if 35 % 10:   # 判断是否有余数  35 // 10 + 1   # 取余数整数部分加1else:  0         # 能整除则直接返回0  # 将这个循环写到一行4 = 35 // 10 + 1 if 35 % 10 else 0
Copier après la connexion

Comment le diviser spécifiquement ?

Prenons comme exemple ce document divisé de 35 pages :

Parcourez chaque page de données pour num dans la plage (35), récupérez les données de chaque page, puis spécifiez la page divisée Divisez la plage de numéros :

  1. Le premier document est de 0 à 10, excluant 10

  2. Le deuxième document est de 10 à 20, excluant 20

  3. Le troisième document est de 20 à 30 , à l'exclusion de 30

  4. Le quatrième document est de 30 à 35, à l'exclusion de 35

Nous avons trouvé un modèle pour parcourir le premier nombre à chaque fois est le nombre de pages d'un document, multiplié par n'importe quel nombre. à laquelle vous appartenez pouvez l'obtenir. Nous avons constaté qu'il n'y a pas de modèle dans le deuxième nombre. En fait, si nous observons attentivement, il y a un modèle. Si nous trions le nombre de divisions, cet exemple est 1--4. Le deuxième nombre est le nombre actuel de divisions. multiplié par chacun Le nombre de pages qui composent le document (le nombre de pages est fixé à 10).

Mais lorsque nous parcourons pour la première fois, nous partons de 0, ce qui rend num inutilisable. Ensuite, nous le modifions et parcourons à partir de 1, range(1,35), parcourons depuis le début, en nous basant sur le fait que la plage le fait. n'inclut pas le dernier en lui-même. Les caractéristiques de (1-1)--10*1, sans compter 10

  1. Le deuxième document est de 10*(2-1)--10*2, sans compter 20.

  2. Le troisième document est de 10* (3-1) -10*3, à l'exclusion de 30
  3. Le quatrième document est de 10(4-1)--35
  4. Le code de traversée spécifique est le suivant :

  5. for num in range(1,35+1):  pass  for i in range(10 * (num-1), 10 * num if num != 4 else 35):    pass
    Copier après la connexion

    Remarque : Lorsque le parcours atteint num = 4 (le dernier numéro de tri du document), renvoyez simplement le nombre total de pages 35, et le parcours se termine ici. Pourquoi le nombre total de pages ici est-il de 35 au lieu de 35+1 ? En effet, nous partons de 0 cette fois et le numéro de page commence à 0, il n'est donc pas nécessaire d'ajouter 1.

Programme de fractionnement complet :

import PyPDF2
Copier après la connexion

Remarque : personnellement, je pense que l'idée de fractionnement ci-dessus est un peu alambiquée. Si vous avez une compréhension approfondie des concepts de découpage des bords et de taille de pas dans les listes Python, je ne le fais pas. Je ne pense pas que ce soit nécessaire. C'est compliqué. Il vous suffit de générer une grande liste du nombre total de pages, puis de diviser la liste en plusieurs petites listes à l'aide de la méthode de découpage. La plage de numéros de page PDF pour chaque division est ensuite la suivante. premier numéro de chaque petite liste - le dernier Numéro +1, j'ai également posté le code que j'ai implémenté en utilisant la méthode list pour votre référence.

Méthode de fractionnement de liste pour diviser un PDF :

#! python
Copier après la connexion

Comment l'utiliser ?

Comment diviser des documents PDF à laide du module PyPDF2 en Python

Maintenez la touche Maj enfoncée dans le dossier du projet, cliquez avec le bouton droit de la souris, choisissez d'ouvrir la fenêtre de commande ici, entrez PDFCF.py, appuyez sur Entrée et modifiez la valeur de n en fonction de vos besoins.

Comment diviser des documents PDF à laide du module PyPDF2 en Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment télécharger Deepseek Xiaomi Comment télécharger Deepseek Xiaomi Feb 19, 2025 pm 05:27 PM

Comment télécharger Deepseek Xiaomi? Recherchez "Deepseek" dans le Xiaomi App Store. Identifiez vos besoins (fichiers de recherche, analyse des données) et recherchez les outils correspondants (tels que les gestionnaires de fichiers, les logiciels d'analyse des données) qui incluent les fonctions Deepseek.

Comment lui demandez-vous Deepseek Comment lui demandez-vous Deepseek Feb 19, 2025 pm 04:42 PM

La clé de l'utilisation efficace de Deepseek est de poser clairement des questions: exprimer les questions directement et spécifiquement. Fournir des détails spécifiques et des informations générales. Pour des demandes complexes, plusieurs angles et opinions de réfutations sont inclus. Concentrez-vous sur des aspects spécifiques, tels que les goulots d'étranglement des performances dans le code. Gardez une réflexion critique sur les réponses que vous obtenez et faites des jugements en fonction de votre expertise.

Comment rechercher Deepseek Comment rechercher Deepseek Feb 19, 2025 pm 05:18 PM

Utilisez simplement la fonction de recherche fournie avec Deepseek. Cependant, pour les recherches impopulaires, les dernières informations ou problèmes qui doivent être prises en compte, il est nécessaire d'ajuster les mots clés ou d'utiliser des descriptions plus spécifiques, de les combiner avec d'autres sources d'informations en temps réel et de comprendre que Deepseek n'est qu'un outil qui nécessite Stratégies de recherche actives, claires et raffinées.

Comment programmer Deepseek Comment programmer Deepseek Feb 19, 2025 pm 05:36 PM

Deepseek n'est pas un langage de programmation, mais un concept de recherche profonde. La mise en œuvre de Deepseek nécessite une sélection en fonction des langues existantes. Pour différents scénarios d'application, il est nécessaire de choisir la langue et les algorithmes appropriés et de combiner la technologie d'apprentissage automatique. La qualité du code, la maintenabilité et les tests sont cruciaux. Ce n'est qu'en choisissant le bon langage de programmation, les algorithmes et les bons outils en fonction de vos besoins et de l'écriture de code de haute qualité que Deepseek peut être mis en œuvre avec succès.

Comment utiliser Deepseek pour régler les comptes Comment utiliser Deepseek pour régler les comptes Feb 19, 2025 pm 04:36 PM

Question: Deepseek est-il disponible pour la comptabilité? Réponse: Non, il s'agit d'un outil d'exploration de données et d'analyse qui peut être utilisé pour analyser les données financières, mais elle n'a pas les fonctions de génération de comptabilité et de génération de rapports des logiciels comptables. L'utilisation de Deepseek pour analyser les données financières nécessite de l'écriture de code pour traiter les données avec une connaissance des structures de données, des algorithmes et des API profonds pour considérer les problèmes potentiels (par exemple, les connaissances en programmation, les courbes d'apprentissage, la qualité des données)

Comment accéder à Deepseekapi - Deepseekapi Access Call Tutoriel Comment accéder à Deepseekapi - Deepseekapi Access Call Tutoriel Mar 12, 2025 pm 12:24 PM

Explication détaillée de Deepseekapi Access and Call: Quick Start Guide Cet article vous guidera en détail comment accéder et appeler Deepseekapi, vous aidant facilement à utiliser des modèles d'IA puissants. Étape 1: Obtenez la clé de l'API pour accéder au site officiel Deepseek et cliquez sur la "plate-forme ouverte" dans le coin supérieur droit. Vous obtiendrez un certain nombre de jetons gratuits (utilisés pour mesurer l'utilisation de l'API). Dans le menu de gauche, cliquez sur "Apikeys" puis cliquez sur "Créer Apikey". Nommez votre apikey (par exemple, "test") et copiez immédiatement la clé générée. Assurez-vous d'enregistrer correctement cette clé, car elle ne sera affichée qu'une seule fois

Mise à jour majeure de Pi Coin: PI Bank arrive! Mise à jour majeure de Pi Coin: PI Bank arrive! Mar 03, 2025 pm 06:18 PM

Pinetwork est sur le point de lancer Pibank, une plate-forme bancaire mobile révolutionnaire! Pinetwork a publié aujourd'hui une mise à jour majeure sur Elmahrosa (face) Pimisrbank, appelée Pibank, qui intègre parfaitement les services bancaires traditionnels avec des fonctions de crypto-monnaie de pignon (prend en charge l'échange entre les Fiat Currency tels que le Dollar, l'Euro, Usdt, Usdc, Ripiah avec des crypto-monnaies. Quel est le charme de Pibank? Découvrons! Les principales fonctions de Pibank: gestion unique des comptes bancaires et des actifs de crypto-monnaie. Soutenez les transactions en temps réel et adoptez les biospécies

Quels sont les outils de découpage d'IA actuels ? Quels sont les outils de découpage d'IA actuels ? Nov 29, 2024 am 10:40 AM

Voici quelques outils de découpage d'IA populaires : TensorFlow DataSetPyTorch DataLoaderDaskCuPyscikit-imageOpenCVKeras ImageDataGenerator

See all articles