Table des matières
Regular Expression
[content]
Maison Tutoriel CMS DEDECMS Comment utiliser la collection dedecms

Comment utiliser la collection dedecms

Jul 16, 2019 pm 03:04 PM
dedecms

En prenant le site officiel de Dreamweaver comme exemple, nous collectons la colonne du didacticiel PHP sous la Webmaster Academy et ouvrons l'adresse de la liste http://www.dedecms.com/web-art/PHP_jiaocheng.

Comment utiliser la collection dedecms

Connectez-vous au backend, entrez « Gestion des nœuds de collection », créez un nouveau nœud et sélectionnez le modèle de contenu comme « Article ordinaire ».

1. Définissez les informations de base du nœud (Apprentissage recommandé : tutoriel dedecms)

Remplissez d'abord un nom de nœud qui est facile à retenir, et sélectionnez Le code de la page cible est GB2312 et le mode anti-hotlink n'a pas besoin d'être défini. Étant donné que le site cible n'a aucune restriction, cet élément ne sera pas modifié. Le délai d'expiration par défaut du système est de 10 secondes.

2. Définir les règles d'acquisition d'URL de liste

Dans cette étape, nous devons effectuer certains réglages, obtenir l'adresse de la liste d'articles, revenir à la page de liste des sites cibles, et observez les changements entre les pages, vous constaterez que seuls les nombres après "14_" ont des changements incrémentiels réguliers.

Page d'accueil : http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_1.html

Milieu : http://www.dedecms.com/web-art/PHP_jiaocheng /list_14_(*).html

Dernière page : http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_172.html

Copiez une adresse de radiomessagerie et revenez à "Nouveau Sur la page "Ajouter un nœud de collecte", sélectionnez "Attribut source" comme "URL de liste de génération par lots", collez l'adresse dans "URL correspondante", modifiez le changement de règle comme (*) et entrez 1 dans "Adresse de génération par lots". Paramètres" (*) Pour 172, cela signifie générer toutes les adresses de la première page aux 172 dernières pages de la liste.

Testez-le, dans la boîte de dialogue contextuelle, nous pouvons voir que 172 enregistrements d'adresses sont mis en boucle et que la configuration est fluide. Parfois, nous rencontrons une liste difficile à obtenir, nous pouvons alors copier l'adresse irrégulière dans la zone de texte « URL de liste spécifiée manuellement » pour la collecter.

3. Définir les règles de correspondance des URL d'article

La page source de l'adresse de l'article a été spécifiée ci-dessus. Dans cette étape, vous devez trouver la page d'adresse de l'article qui répond aux exigences. exigences parmi ces pages. Ouvrez une page de liste et observez que la case dans la colonne de gauche contient toutes les adresses dont nous avons besoin. Dans ce cas, les pages clairement distinguées peuvent être filtrées à l'aide du "HTML au début de la région" et du "HTMLL à la fin". de la région".

Cependant, d’autres méthodes peuvent également être utilisées. Déplacez la souris sur différentes adresses de lien et observez l'adresse complète affichée dans le coin inférieur gauche du navigateur. Les adresses dont nous avons besoin contiennent toutes "PHP_jiaocheng/20", puis nous la remplissons dans "Doit contenir".

Les deux méthodes peuvent filtrer les adresses. Lorsqu'il s'agit de pages complexes, elles peuvent être utilisées ensemble. Avec l'ajout de règles régulières, il n'y a presque aucune adresse qui ne puisse être filtrée. Confirmez enfin et passez à l'étape suivante "Règles d'acquisition de contenu Web".

Comment utiliser la collection dedecms

4. Règles d'acquisition de contenu de page Web

Ce qui précède présente la méthode de paramétrage de liste, nous entrons ensuite dans le paramétrage de l'acquisition de contenu. règles, si la collection doit servir, la fonction des une à trois étapes ci-dessus est simplement que l'apéritif sert de guide pour le plat principal suivant. L'étape suivante consiste à présenter comment collecter le contenu de l'article à partir du site cible. Cette étape constitue la partie la plus essentielle de toute la collection.

Continuez en revenant à la liste des tutoriels PHP de DreamWeaver et ouvrez un article dans la liste. Ici, nous prenons l'article "Expressions régulières" comme exemple : http://www.dedecms.com/web -art. /PHP_jiaocheng/20070420/38633.html, copiez l'adresse dans « URL d'aperçu » car tous les articles de DreamWeaver ne sont pas paginés, il n'est pas nécessaire de définir la pagination ici et vous pouvez accéder directement à la page « Projet de collection fixe » ;

(Remarque : si le contenu collecté contient une pagination, il vous suffit de définir les règles de correspondance dans la partie de navigation de pagination. Voici toutes les listes de pagination répertoriées, les pages du haut et du bas ou les listes de pagination incomplètes à définir en fonction le contenu. Oui)

Ce qui suit est le contenu cité :

Toutes les listes paginées répertoriées : Le contenu paginé répertorie tous les liens, comme indiqué ci-dessous

Formulaire de page haut et bas ou liste de pagination incomplète : une seule page affiche le contenu de la pagination actuelle, formulaire de liste d'affichage incomplet

5 Articles de collection fixes

Entrez ici dans le. première étape, nous commençons à analyser le code source de la page. La collection n'est rien de plus que l'analyse de la structure de la page HTML pour obtenir le contenu dont nous avons besoin. Par conséquent, nous devons avoir une certaine compréhension du code HTML et être capables de trouver le contenu requis en visualisant le fichier source de la page. Il est préférable d'ouvrir quelques pages supplémentaires pour analyser et trouver les similitudes.

Il est recommandé d'utiliser l'analyse Dreamweaver. Lors de l'analyse du code de la page, il sera beaucoup plus pratique d'utiliser la fonction de recherche plus souvent. Surtout après avoir trouvé la balise, recherchez s'il y a des doublons pour réduire les erreurs d'analyse.

1) Titre de l'article : Le titre de cette page est "Expression régulière". Copiez-le et appuyez sur Ctrl+F dans Dreamweaver pour rechercher tous les enregistrements. En raison de son caractère unique, nous sélectionnons ici la balise "

Regular Expression

" sur la ligne 105, la copions dans la règle de correspondance du titre de l'article "Fixed Collection Project" et la remplaçons par le mot-clé "[ content]" Titre, finalement

[content]

.

2) Auteur : continuez la recherche avec auteur comme mot-clé. Seules 110 lignes ont des occurrences uniques. Copiez-les avec les balises avant et après toute utilisation des règles de correspondance et utilisez [contenu] pour remplacer l'endroit par. être collectés.

3) Source : Idem que ci-dessus. Recherchez la balise sur la ligne 109, copiez-la et utilisez [content] pour remplacer le lieu à collecter. Si la source contient des balises de lien hypertexte que vous souhaitez supprimer, dans la zone des règles de filtrage, remplissez les règles suivantes pour filtrer :

<a>]*)> <br></a><br>
Copier après la connexion

4) Heure de sortie : Copiez, collez et modifiez les mêmes opérations que ci-dessus à ligne 111.

5) Contenu de l'article : recherchez le début du contenu de l'article. Par exemple, "Première partie" a trouvé la cible à la ligne 118. Cliquez sur la barre d'état

sélectionné. Passez au

précédent, le contenu bleu sélectionne tout le contenu, sachant que
est le véritable conteneur du contenu de l'article. Copiez les balises avant et après le contenu dans les règles de correspondance.

À ce stade, les paramètres de filtrage de contenu sont terminés.

6. Collecte de nœuds

Si votre nœud de collecte est terminé en une seule fois et que le test est réussi, cliquez sur le bouton lorsque vous êtes invité à collecter directement, mais le nœud est écrit avant Oui, vous devez vous rendre sur la « Page de gestion des nœuds » pour vérifier les nœuds à collecter et appuyer sur le bouton « Collecter » pour collecter. Si vous souhaitez collecter du nouveau contenu à partir de tous les nœuds, accédez à la page de collecte de surveillance pour fonctionner.

Vous pouvez définir le nombre de données collectées par page pour chaque collection de pages. De manière générale, ne le définissez pas trop haut, sinon le système pourrait ne pas être en mesure de les traiter et certaines parties ne pourraient pas être collectées. recommandé de ne pas dépasser 15.

Le nombre de threads fait référence au nombre de threads collectés en même temps à chaque fois. Une augmentation du nombre de threads peut accélérer la collecte, mais cela augmentera également l'occupation des ressources du serveur, alors s'il vous plaît. utilisez-le avec prudence. Si le site cible a une limite d'anti-rafraîchissement, vous pouvez la définir ici en fonction du temps limite d'anti-rafraîchissement du site cible. Sinon, la valeur par défaut est de 0 seconde.

Options supplémentaires Ces trois paramètres doivent être faciles à comprendre littéralement, afin que vous puissiez choisir en fonction de vos besoins réels.

Collection terminée.

Pour plus d'articles techniques liés à WordPress, veuillez visiter la colonne tutoriel WordPress pour apprendre !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Où se trouve le modèle de réseau de ressources Imperial CMS ? Où se trouve le modèle de réseau de ressources Imperial CMS ? Apr 17, 2024 am 10:00 AM

Emplacement de téléchargement du modèle Empire CMS : Téléchargement du modèle officiel : https://www.phome.net/template/ Site Web du modèle tiers : https://www.dedecms.com/diy/https://www.0978.com. cn /https://www.jiaocheng.com/Méthode d'installation : Télécharger le modèle Décompresser le modèle Télécharger le modèle Sélectionner le modèle

Comment dedecms implémente le remplacement de modèle Comment dedecms implémente le remplacement de modèle Apr 16, 2024 pm 12:12 PM

Le remplacement du modèle peut être implémenté dans Dedecms en suivant les étapes suivantes : modifier le fichier global.cfg et définir le pack de langue requis. Modifiez le fichier hook taglib.inc.php et ajoutez la prise en charge des fichiers modèles de suffixes de langue. Créez un nouveau fichier modèle avec un suffixe de langue et modifiez le contenu requis. Videz le cache Dedecms.

Comment télécharger des vidéos locales sur dedecms Comment télécharger des vidéos locales sur dedecms Apr 16, 2024 pm 12:39 PM

Comment mettre en ligne des vidéos locales à l'aide de Dedecms ? Préparez le fichier vidéo dans un format pris en charge par Dedecms. Connectez-vous au backend de gestion Dedecms et créez une nouvelle catégorie de vidéo. Téléchargez des fichiers vidéo sur la page de gestion vidéo, remplissez les informations pertinentes et sélectionnez la catégorie vidéo. Pour intégrer une vidéo lors de l'édition d'un article, saisissez le nom de fichier de la vidéo téléchargée et ajustez ses dimensions.

Quel site Web les dedecms peuvent-ils faire ? Quel site Web les dedecms peuvent-ils faire ? Apr 16, 2024 pm 12:24 PM

Dedecms est un CMS open source qui peut être utilisé pour créer différents types de sites Web, notamment : des sites Web d'actualités, des sites Web de blogs, des sites Web de commerce électronique, des forums et des sites Web communautaires, des sites Web éducatifs, des sites Web portails, d'autres types de sites Web (tels que des sites Web d'entreprise). , sites Web personnels, sites Web d'albums photos, sites Web de partage de vidéos)

Comment utiliser les décms Comment utiliser les décms Apr 16, 2024 pm 12:15 PM

Dedecms est un système CMS chinois open source qui assure la gestion de contenu, un système de modèles et une protection de sécurité. L'utilisation spécifique comprend les étapes suivantes : 1. Installez Dedecms. 2. Configurez la base de données. 3. Connectez-vous à l'interface de gestion. 4. Créez du contenu. 5. Configurez le modèle. 6. Gérer les utilisateurs. 7. Entretenir le système.

Rapport d'évaluation de l'outil de conversion dedecms précis et fiable Rapport d'évaluation de l'outil de conversion dedecms précis et fiable Mar 12, 2024 pm 07:03 PM

Rapport d'évaluation de l'outil de conversion dedecms précis et fiable Avec le développement rapide de l'ère Internet, la construction de sites Web est devenue l'un des outils nécessaires pour de nombreuses entreprises et particuliers. Dans la construction de sites Web, l’utilisation d’un système de gestion de contenu (CMS) peut gérer le contenu et les fonctions du site Web de manière plus pratique et plus efficace. Parmi eux, dedecms, en tant que système CMS bien connu, est largement utilisé dans divers projets de construction de sites Web. Cependant, nous sommes parfois confrontés à la nécessité de convertir le site Web dedecms vers d'autres formats, auquel cas nous devons utiliser un outil de conversion.

Quelles sont les failles des dedecms ? Quelles sont les failles des dedecms ? Aug 03, 2023 pm 03:56 PM

DedeCMS est un système de gestion de contenu open source qui présente certaines vulnérabilités et risques de sécurité potentiels : 1. Vulnérabilité d'injection SQL. Les attaquants peuvent effectuer des opérations non autorisées ou obtenir des données sensibles en construisant des instructions de requête SQL malveillantes. 2. Vulnérabilité de téléchargement de fichiers, les attaquants peuvent télécharger des fichiers contenant ; code malveillant sur le serveur pour exécuter du code arbitraire ou obtenir des autorisations du serveur ; 3. Fuite d'informations sensibles 4. Exploitation de vulnérabilités non authentifiées ;

Un moyen simple d'apprendre la fonction de conversion de codage dedecms Un moyen simple d'apprendre la fonction de conversion de codage dedecms Mar 14, 2024 pm 02:09 PM

L'apprentissage de la fonction de conversion d'encodage dedecms n'est pas compliqué. Des exemples de code simples peuvent vous aider à maîtriser rapidement cette compétence. Dans les dedecms, la fonction de conversion de codage est généralement utilisée pour traiter des problèmes tels que les caractères chinois tronqués et les caractères spéciaux afin de garantir le fonctionnement normal du système et l'exactitude des données. Ce qui suit présentera en détail comment utiliser la fonction de conversion d'encodage de dedecms, vous permettant de faire face facilement à divers besoins liés à l'encodage. 1.UTF-8 en GBK En dedecms, si vous devez convertir une chaîne codée UTF-8 en G

See all articles