Développement de mini-programmes et analyse de contenu Web

巴扎黑
Libérer: 2017-08-23 16:10:40
original
1598 Les gens l'ont consulté


Explication détaillée de l'analyse du contenu Web dans l'applet WeChat

J'écris actuellement un robot d'exploration qui doit analyser les pages Web pour une utilisation par WeChat applet. L'analyse du texte et de l'image est facile à comprendre, et le mini-programme dispose également de balises de texte et d'image correspondantes pour la présentation. Les plus complexes, comme les tableaux, sont plus difficiles à résoudre, qu'il s'agisse d'analyse côté serveur ou de rendu de mini-programmes, et il est difficile de couvrir toutes les situations. J'ai donc pensé que convertir le code HTML correspondant au tableau en images serait une solution de contournement.

Ici, nous utilisons le module node-webshot, qui encapsule de manière légère PhantomJS et peut facilement enregistrer des pages Web sous forme de captures d'écran.

Installez d'abord Node.js et PhantomJS, puis créez un nouveau fichier js et chargez le module node-webshot :

const webshot = require('webshot');
Copier après la connexion

Définissez les options :

const options = {  // 浏览器窗口 
 screenSize: {  
   width: 755,  
     height: 25  },  // 要截图的页面文档区域 
      shotSize: {   
       height: 'all'  },  // 网页类型  
       siteType: 'html'
       };
Copier après la connexion

Ici , parcourir La largeur de la fenêtre du navigateur doit être définie de manière raisonnable en fonction de la situation de la page Web. La hauteur peut être définie sur une très petite valeur. Ensuite, la hauteur de la zone du document de la page doit être définie sur tout. la largeur de la fenêtre, afin que le tableau puisse être entièrement capturé à la plus petite taille.

Ensuite, définissez la chaîne html :

let html = "target rich text html code, eg: <table>...</table>";
Copier après la connexion

Notez que le code HTML à l'intérieur doit supprimer les sauts de ligne et remplacer les guillemets doubles par des guillemets simples.

Enfin, capture d'écran :

webshot(html, &#39;demo.png&#39;, options, (err) => {  if (err)   
 console.log(`Webshot error: ${err.message}`);});
Copier après la connexion

De cette manière, la conversion du code HTML en image locale est réalisée, qui peut être téléchargée sur Qiniu Cloud et ainsi de suite. Qu'il s'agisse d'analyse côté serveur ou de présentation de mini-programme, il n'y a aucune difficulté...

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal