Utiliser des expressions régulières pour extraire le contenu de pages Web est assez fastidieux. Voici une bibliothèque Python qui peut extraire des données de fichiers HTML ou XML : Beautiful Soup Il peut réaliser une navigation idiomatique dans les documents via votre convertisseur préféré, comment rechercher et modifier. documents. Beautiful Soup vous aidera à économiser des heures voire des jours de travail Document Beautiful Soup 4.2.0
L'application spécifique a été clairement décrite dans le document officiel, la voici Pas plus de détails. Permettez-moi de parler des problèmes que j'ai rencontrés lors de l'installation.
1. Installez python3
Téléchargez et installez python3 depuis le site officiel, ajoutez la variable Path et renommez le python.exe installé en python3.exe
2. Installez pip3
Input:>pip3
Invite de problème : erreur fatale dans le lanceur : impossible de créer un processus à l'aide de '"'
Input:>python3 -m pip install --upgrade pip
Invite du problème :Exigence déjà à jour : pip dans c:users****appdatalocalprogramspythonpython36-32libsite-packages
Input:>python3 -m pip install --upgrade pip --force-reinstall
Sortie :
Entrée : >pip3 -V
Sortie : pip 9.0.1 de c:users****appdatalocalprogramspythonpython36-32libsite- packages (python 3.6)
installation de pip3 terminée
3. Installez BeautifulSoup4
>pip3 install beautifulsoup4
Si vous souhaitez installer avec le code source, téléchargez le code source de BS4, puis installez-le via setup.py
Décompressez localement le package compressé téléchargé et utilisez la commande pour le convertir en code Python3 :
Entrez Toolsscripts dans l'installation de Python. répertoire, qui contient 2to3.py , utilisez la commande pour convertir
Python36-32Toolsscripts>python 2to3.py -w C:Users****AppDataLocalProgramsPythonPython36-32beautifulsoup4-4.6.0
Utiliser l'invite de commande pour accéder au répertoire de décompression BS4, démarrez l'installation :
>python setup.py install
4. Installez l'analyseur :
>pip3 install lxml.
>pip3 install html5lib
L'installation est terminée ! Il est temps de commencer les tests.
Il existe de nombreux codes BeautifulSoup3 et Python2 sur Internet, et divers problèmes surviendront lors de leur test par rapport aux démos données. Il est recommandé de se référer directement à la documentation officielle lors de l'apprentissage de nouveaux contenus.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!