


Comment convertir les pages HTML de différentes hauteurs en images en totalité en utilisant Java et Selenium?
Java et sélénium: intercepter complètement les pages HTML de toute hauteur
Cet article détaille comment utiliser les bibliothèques Java et Selenium pour surmonter les limitations de hauteur, intercepter complètement les pages HTML et les convertir en images. Les méthodes traditionnelles sont sujettes à manquer de contenu lorsqu'ils traitent des pages élevées. Cet article fournit une solution pour les captures d'écran segmentées et l'épissage. Nous allons démontrer en utilisant JDK 8 et Selenium-Java (3.141.59).
Défi: le puzzle des captures d'écran High Page
Pour des pages plus courtes, prenez simplement une capture d'écran. Mais les pages plus élevées ne le sont pas. Utiliser simplement window.scrollby(0, x)
pour faire défiler et prendre des captures d'écran entraîne souvent une perte de contenu, par exemple, le contenu de certains numéros de ligne peut ne pas être complètement affiché.
Solution: captures d'écran segmentées, coutures parfaites
Notre stratégie est de diviser la page en plusieurs parties, de prendre des captures d'écran séparément et enfin d'épisser ces images en une longue image complète. La clé est que la hauteur de chaque parchemin est légèrement plus petite que la hauteur de la capture d'écran, garantissant que certaines images se chevauchent et évitent la perte de contenu.
Étapes Explication détaillée:
-
Configuration de l'environnement: définissez le chemin de chromedriver et configurez les options de chrome, activez le mode sans tête pour améliorer l'efficacité et définir la taille de la fenêtre.
String chromepath = "d: \\ htmltoimg \\ sélénium \\ chromedriver-win64 \\ chromedriver.exe"; System.SetProperty ("webDriver.chrome.driver", ChromePath); Options ChromeOptions = Nouvelles ChromeOptions (); options.AddDarguments ("- Headless"); options.AddDarguments ("- Window-Size = 2160,1440"); WebDriver Driver = new ChromEdriver (Options);
Copier après la connexion -
Chargement et attente de la page: Chargement des fichiers HTML et utilisant des attentes explicites pour s'assurer que la page est entièrement chargée.
driver.get ("file: /// d: /htmltoimg/test.html"); WebDriverWait wait = new WebDriverWait (pilote, 15); wait.until (attendConditions.VisibilityOfElementlocated (par.tagname ("corps")));
Copier après la connexion -
Calculez le nombre de captures d'écran: utilisez JavaScript pour obtenir la hauteur totale de la page et calculez le nombre de captures d'écran requises en fonction de la hauteur de chaque capture d'écran.
JavascripTexecutor js = (javascripTexecutor) pilote; Long PageHeight = (long) Js.Executescript ("return document.body.scrollHeight;"); int captureHeight = 5000; // Hauteur de chaque interception int numberofScreenshots = (int) math.ceil ((double) pageHeight / captureHeight);
Copier après la connexion -
Captures d'écran segmentées et défilement: Captures d'écran en boucle, après chaque capture d'écran, utilisez JavaScript pour faire défiler la page. La distance de défilement est légèrement plus petite que la hauteur de capture d'écran, assurant le chevauchement.
int totalHeight = 0; Liste<file> files = new ArrayList (); pour (int i = 0; i <nombreofscreenshots i ... de recherche enregistrer en tant que fichier temporaire et ajouter la liste des fichiers js.executescript d laissant un chevauchement partiel></nombreofscreenshots></file>
Copier après la connexion -
Coux d'image: lisez toutes les images temporaires, calculez la largeur totale et tracez l'image dans un nouvel objet
BufferedImage
.int largeur = 0; pour (fichier de fichier: fichiers) { BufferedImage img = imageo.read (fichier); width = math.max (img.getWidth (), largeur); } BufferedImage CombinedImage = new BufferedImage (Width, TotalHeight, BufferedImage.Type_int_argb); Graphics2d g = combinéemage.creategraphics (); int nowyIndex = 0; pour (fichier de fichier: fichiers) { BufferedImage img = imageo.read (fichier); G.DrawImage (IMG, 0, NowyIndex, null); NowyIndex = img.getheight (); } g.dispose (); ImageIo.write (CombinedImage, "Png", nouveau fichier ("d: \\ htmltoimg \\ Selenium \\ output \\ Merge.png"));
Copier après la connexion
Grâce aux étapes ci-dessus, vous pouvez capturer complètement les pages HTML de n'importe quelle hauteur et générer une image complète. N'oubliez pas d'ajouter des captures d'écran et du code de suppression de fichiers, ainsi que la gestion nécessaire des exceptions. Cette méthode est efficace et fiable, résolvant le problème du contenu manquant rencontré par les méthodes traditionnelles lors de la prise de captures d'écran de pages élevées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

L'application OUYI Exchange prend en charge le téléchargement des téléphones mobiles Apple, visitez le site officiel, cliquez sur l'option "Apple Mobile", obtenez-la et installez-la dans l'App Store, Inscrivez-vous ou connectez-vous pour effectuer le trading des crypto-monnaies.

L'utilisation de la bibliothèque Chrono en C peut vous permettre de contrôler plus précisément les intervalles de temps et de temps. Explorons le charme de cette bibliothèque. La bibliothèque Chrono de C fait partie de la bibliothèque standard, qui fournit une façon moderne de gérer les intervalles de temps et de temps. Pour les programmeurs qui ont souffert de temps et ctime, Chrono est sans aucun doute une aubaine. Il améliore non seulement la lisibilité et la maintenabilité du code, mais offre également une précision et une flexibilité plus élevées. Commençons par les bases. La bibliothèque Chrono comprend principalement les composants clés suivants: std :: chrono :: system_clock: représente l'horloge système, utilisée pour obtenir l'heure actuelle. std :: chron

Memebox 2.0 redéfinit la gestion des actifs cryptographiques grâce à une architecture innovante et à des percées de performance. 1) Il résout trois principaux points de douleur: les silos d'actifs, la désintégration du revenu et le paradoxe de la sécurité et de la commodité. 2) Grâce à des pôles d'actifs intelligents, à la gestion des risques dynamiques et aux moteurs d'amélioration du rendement, la vitesse de transfert croisée, le taux de rendement moyen et la vitesse de réponse aux incidents de sécurité sont améliorés. 3) Fournir aux utilisateurs la visualisation des actifs, l'automatisation des politiques et l'intégration de la gouvernance, réalisant la reconstruction de la valeur utilisateur. 4) Grâce à la collaboration écologique et à l'innovation de la conformité, l'efficacité globale de la plate-forme a été améliorée. 5) À l'avenir, les pools d'assurance-contrat intelligents, l'intégration du marché des prévisions et l'allocation d'actifs axés sur l'IA seront lancés pour continuer à diriger le développement de l'industrie.

Les dix principales plates-formes de trading de crypto-monnaie au monde comprennent Binance, Okx, Gate.io, Coinbase, Kraken, Huobi Global, BitFinex, Bittrex, Kucoin et Poloniex, qui fournissent toutes une variété de méthodes de trading et de puissantes mesures de sécurité.

La mesure des performances du thread en C peut utiliser les outils de synchronisation, les outils d'analyse des performances et les minuteries personnalisées dans la bibliothèque standard. 1. Utilisez la bibliothèque pour mesurer le temps d'exécution. 2. Utilisez le GPROF pour l'analyse des performances. Les étapes incluent l'ajout de l'option -pg pendant la compilation, l'exécution du programme pour générer un fichier gmon.out et la génération d'un rapport de performances. 3. Utilisez le module Callgrind de Valgrind pour effectuer une analyse plus détaillée. Les étapes incluent l'exécution du programme pour générer le fichier callgrind.out et la visualisation des résultats à l'aide de Kcachegrind. 4. Les minuteries personnalisées peuvent mesurer de manière flexible le temps d'exécution d'un segment de code spécifique. Ces méthodes aident à bien comprendre les performances du thread et à optimiser le code.

Plate-forme de trading de devises numériques fiables recommandées: 1. Okx, 2. Binance, 3. Coinbase, 4. Kraken, 5. Huobi, 6. Kucoin, 7. Bitfinex, 8. Gemini, 9. Bitstamp, 10. Poloniex, ces plates-formes sont connu

Les dix premiers échanges de devises numériques tels que Binance, OKX, Gate.io ont amélioré leurs systèmes, des transactions diversifiées efficaces et des mesures de sécurité strictes.

Actuellement classé parmi les dix premiers échanges de devises virtuels: 1. Binance, 2. Okx, 3. Gate.io, 4. Coin Library, 5. Siren, 6. Huobi Global Station, 7. Bybit, 8. Kucoin, 9. Bitcoin, 10. Bit Stamp.
