Quelle est la fonction du module de collecte fourni avec Phpcms v9, l'un des systèmes CMS grand public ? Phpcms v9 a trois modèles de contenu intégrés par défaut : articles, images et téléchargements. collection d'articles communs d'abord. Si vous êtes intéressé, ne le manquez pas Haha, j'espère que cela pourra vous aider
La dernière version du système de gestion de site Web Phpcms est Phpcms v9. En Chine, il a été appliqué à des dizaines de milliers de sites Web. Jetons donc un œil aux fonctions de son propre module de collection.
Collection d'articles
Phpcms v9 dispose de trois modèles de contenu intégrés : articles, images et téléchargements par défaut. Examinons d'abord la collection d'articles la plus courante. Prenons comme exemple la collection de chaînes Internet Sina et de chroniques d'actualités nationales http://roll.tech.sina.com.cn/internet_chinalist/index_1.shtml
1 Entrez l'arrière-plan, le contenu - la publication du contenu. gestion - Gestion des collections - ajouter des points de collecte. (Contrairement aux versions précédentes de Phpcms, la gestion des collections se fait dans le menu du module)
2. Règles d'URL. Remplissez le nom du projet de collection avec désinvolture et l'encodage de la page de collection est par défaut GBK. Lors de la collecte d'une page spécifique, vous pouvez afficher le code source de sa page Web.
Collection de sites Web, il n'y a pas de grande fonctionnalité, remplissez-la en vérifiant les règles d'URL de la page que vous souhaitez collecter. L'analyse de la page cible montre qu'il s'agit d'une séquence d'URL, et les URL du contenu à obtenir se trouvent entre les deux balises et . Il n'y a pas d'autres liens interférents, il n'est donc pas nécessaire de définir des caractères qui doivent ou ne doivent pas être inclus dans l'URL. Si le site Web cible est configuré avec Base, il doit également être configuré.
La configuration de la collection d'URL est terminée, mais si la page de liste de sites Web cible utilise js pour implémenter les pages supérieure et inférieure, ou si la profondeur de l'URL à obtenir dépasse 2 niveaux, il sera difficile d'y parvenir avec cette collection intégrée.
3. Règles de contenu. phpcms utilise "[content]" comme caractère générique, puis définit les caractères de début et de fin, puis filtre les codes indésirables pour collecter le contenu. La balise de titre de la page cible de l'analyse est relativement régulière et peut être définie directement comme le montre la figure.
Le format du filtre est "Contenu à filtrer [|] Valeur de remplacement". S'il est supprimé, laissez la valeur de remplacement vide. Les règles de filtrage prennent en charge les expressions régulières. Le système est livré avec plusieurs règles de filtrage de balises courantes. Il est un peu difficile pour les novices de filtrer de manière plus flexible, les novices doivent donc d'abord se familiariser avec les expressions régulières.
Les règles d'auteur, les règles de source et les règles de temps sont obtenues conformément aux règles. L'éditeur a essayé la valeur fixe et a constaté qu'elle ne pouvait pas être obtenue, c'est-à-dire définir une certaine balise comme valeur fixe. Par exemple, définir la « source » sur http://www.sina.com.cn, mais la source. La balise du résultat de la collecte est vide.
Règles de contenu, remplissez les balises d'ouverture et de fermeture, la page cible que nous avons testée est relativement propre, il nous suffit donc de filtrer les hyperliens et quelques balises inutiles à l'intérieur.
Règles de pagination du contenu. Si la page de contenu a une pagination, elle doit être renseignée. Il n'y a pas de pagination dans les articles ici L'éditeur introduira cette balise dans la suite. collection d'images.
4. Personnaliser les règles. En plus des balises par défaut du système, vous pouvez également personnaliser diverses balises. Les règles sont les mêmes, mais il y a une chose à noter : le nom anglais de la règle doit être. rempli, sinon il sera automatiquement L'étiquette de définition ne peut pas être enregistrée.
5. Configuration avancée, cette fois, vous pouvez définir les images de téléchargement, les filigranes d'images, la pagination du contenu et l'ordre d'importation. Notez que si vous avez besoin d'un filigrane, pensez à modifier l'image du filigrane de votre site Web. Le chemin de stockage du filigrane est : statics/images/water
6. Une fois les règles définies. défini, soumettez-le à la collection. Pour gérer la page d'accueil, vous pouvez d'abord tester pour voir si chaque étiquette est exacte.
7. Publier du contenu. S'ils sont tous exacts, cliquez d'abord sur Collecter l'URL. L'adresse de l'article sera automatiquement collectée et les URL en double seront filtrées. Ensuite, un message indiquant que la collecte des URL est terminée apparaîtra. Cliquez sur "Collecter le contenu de l'article"
La collecte se poursuivra automatiquement et la progression de la collecte sera affichée.
Une fois la collection terminée, vous reviendrez automatiquement à la page d'accueil de gestion de la collection, cliquez sur Publier du contenu, entrez la liste des articles collectés, cochez les articles à publier, ou cliquez directement sur Importer tout en bas.
Entrez dans l'interface de sélection du plan de publication, créez un nouveau plan de publication, et sélectionnez une colonne de publication. Ce test a sélectionné la colonne « domestique » du module d'article, qui peut être. défini sur la nouvelle page du plan. Extrayez automatiquement les résumés, extrayez automatiquement les vignettes, importez le statut de l'article, les balises et la correspondance de la base de données. Parmi eux, il n'existe qu'un seul statut « Publier » pour les articles importés. Si le webmaster souhaite que le statut soit en attente de révision, il doit d'abord modifier le workflow de la colonne correspondante pour qu'il soit en révision de premier niveau.
Dans la relation correspondante entre les balises et les bases de données, faites correspondre les balises de collection avec les champs de la base de données un à un. S'il existe une balise personnalisée qui ne trouve pas le champ correspondant, vous devez modifier le modèle pour ajouter le champ, puis l'afficher en modifiant le modèle a des exigences techniques relativement élevées et ne convient pas aux novices. De plus, le système est doté de plusieurs fonctions de traitement, qui sont également très pratiques.
Le plan de publication est mis en place et l'article que vous venez de sélectionner commencera automatiquement à être importé. Il n'est pas nécessaire de créer un plan pour la prochaine importation, il suffit de sélectionner le. plan déjà construit.
Collection et publication des articles terminées. Jetez un œil à l'effet :
Page de gestion de contenu backend
Page de contenu
Voyons jetez un oeil ci-dessous Regardez la collection d'images
Collection d'images
phpcms v9 est livré avec un modèle d'image, et il existe également un mode d'image de groupe pour le traitement des images, qui est pratique pour certains webmasters pour créer des sites Web d’images ou configurer des affichages d’images. Faisons l'expérience de l'utilisation du programme de collecte intégré pour collecter des images. Prenons comme exemple la collection d'images de la page http://www.4493.com/mingxingxiezhen/ :
Règles d'acquisition de sites Web et règles d'acquisition de contenu. sont tous conformes à l'article. La collection est la même, mais le point le plus important est que la collection d'images de phpcms v9 ne peut pas seulement collecter l'adresse de l'image, mais doit collecter l'intégralité de la balise dans une photo de groupe. Comme dans cet exemple : La balise de contenu est définie sur
Le contenu collecté devrait être comme ceci
Il y a également une question de pagination, la pagination du site cible est comme indiqué sur la figure :
Le code de la page Web est :
Alors ajoutez simplement le contenu Sélectionnez le mode liste tous pour les règles de pagination, puis remplissez les caractères de début et de fin de la balise de pagination, et le système collectera automatiquement le contenu de la pagination.
Après avoir défini les règles, collectez l'URL, collectez le contenu et publiez le contenu. Veuillez faire attention lors de la publication du plan. Après plusieurs tentatives, l'éditeur a constaté que pour implémenter le mode image de groupe, le champ de contenu et le champ d'image de groupe doivent utiliser la fonction « traiter comme image de groupe ». Mais de cette manière, il est impossible d'obtenir l'image du contenu sous forme de vignette, il est donc préférable de personnaliser une étiquette de vignette et d'obtenir directement l'adresse d'une image de contenu sous forme de vignette.
Publiez après la configuration. Voir l'effet de collection :
Page de colonne
Page de contenu
Résumé : Après une expérience minutieuse, la fonction de collecte de phpcms v9 est assez complète, ce qui peut répondre à la collection de base d'articles et d'images. Cependant, il n'est pas assez flexible, ce qui est évidemment insuffisant pour certains webmasters aux exigences élevées. De plus, le seuil est élevé, et la description officielle et les fichiers d'aide du module de collecte sont très limités, ce qui ne permet pas aux novices de se lancer. .
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!