Cet article présente principalement l'explication détaillée et des exemples d'analyse du contenu des pages Web par l'applet WeChat. Ici, nous utilisons des robots pour explorer des pages Web complexes. Si nous rencontrons des problèmes, nous les trierons et les résoudrons ici. ils peuvent s'y référer.
Explication détaillée de l'analyse du contenu Web par l'applet WeChat
J'écris actuellement un robot d'exploration qui doit analyser les pages Web pour être utilisées par l'applet WeChat. L'analyse du texte et de l'image est facile à comprendre, et le mini-programme dispose également de balises de texte et d'image correspondantes pour la présentation. Les plus complexes, comme les tableaux, sont plus difficiles. Qu'il s'agisse d'analyse côté serveur ou de rendu de mini-programmes, c'est très laborieux et il est difficile de couvrir toutes les situations. J'ai donc pensé que convertir le code HTML correspondant au tableau en images serait une solution de contournement.
Ici, nous utilisons le module node-webshot, qui encapsule de manière légère PhantomJS et peut facilement enregistrer des pages Web sous forme de captures d'écran.
Installez d'abord Node.js et PhantomJS, puis créez un nouveau fichier js et chargez le module node-webshot :
const webshot = require('webshot');
Définissez les options :
const options = { // 浏览器窗口 screenSize: { width: 755, height: 25 }, // 要截图的页面文档区域 shotSize: { height: 'all' }, // 网页类型 siteType: 'html' };
Ici , parcourir La largeur de la fenêtre du navigateur doit être définie de manière raisonnable en fonction de la situation de la page Web. La hauteur peut être définie sur une très petite valeur. Ensuite, la hauteur de la zone du document de la page doit être définie sur tout. la largeur de la fenêtre, afin que le tableau puisse être entièrement capturé à la plus petite taille.
Ensuite, définissez la chaîne html :
let html = "target rich text html code, eg: <table>...</table>";
Notez que le code HTML à l'intérieur doit supprimer les sauts de ligne et remplacer les guillemets doubles par des guillemets simples.
Enfin, capture d'écran :
webshot(html, 'demo.png', options, (err) => { if (err) console.log(`Webshot error: ${err.message}`); });
De cette façon, la conversion du code HTML en image locale est réalisée, qui peut être téléchargée sur Qiniu Cloud et ainsi de suite. Qu'il s'agisse d'analyse côté serveur ou de présentation de mini-programme, il n'y a aucune difficulté...
Merci d'avoir lu, j'espère que cela pourra aider tout le monde, merci pour votre soutien à ce site !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!