Comment utiliser Scrapy pour explorer les chansons de Kugou Music ?-Tutoriel Python-php.cn

Maison

développement back-end

Tutoriel Python

Comment utiliser Scrapy pour explorer les chansons de Kugou Music ?

PHPz

Jun 22, 2023 pm 10:59 PM

爬取 scrapy 酷狗音乐

Avec le développement d'Internet, la quantité d'informations sur Internet augmente et les utilisateurs doivent explorer les informations de différents sites Web pour effectuer diverses analyses et explorations. Scrapy est un framework d'exploration Python entièrement fonctionnel qui peut analyser automatiquement les données d'un site Web et les afficher sous une forme structurée. Kugou Music est l'une des plateformes de musique en ligne les plus populaires. Ci-dessous, je vais vous présenter comment utiliser Scrapy pour explorer les informations sur les chansons de Kugou Music.

1. Installez Scrapy

Scrapy est un framework basé sur le langage Python, vous devez donc d'abord configurer l'environnement Python. Avant d'installer Scrapy, vous devez d'abord installer les outils Python et pip. Une fois l'installation terminée, vous pouvez installer Scrapy via la commande suivante :

pip install scrapy

Copier après la connexion

2. Créer un nouveau projet Scrapy

Scrapy fournit un ensemble d'outils de ligne de commande pour nous faciliter la création de nouveaux projets. Entrez le code suivant dans la ligne de commande :

scrapy startproject kuwo_music

Copier après la connexion

Après exécution, un projet Scrapy nommé "kuwo_music" sera créé dans le répertoire courant. Dans ce projet, nous devons créer un nouveau robot pour explorer les informations sur les chansons de Kugou Music.

3. Créer un nouveau robot d'exploration

Dans le projet Scrapy, un robot d'exploration est un programme utilisé pour explorer et analyser les données d'un site Web spécifique. Dans le répertoire du projet "kuwo_music", exécutez la commande suivante :

scrapy genspider kuwo www.kuwo.cn

Copier après la connexion

La commande ci-dessus créera un fichier nommé "kuwo.py" dans le répertoire "kuwo_music/spiders", qui est le code de notre programme de robot d'exploration. Nous devons définir le processus d'exploration et d'analyse des données du site Web dans ce fichier.

4. Demande de site Web et analyse de page

Dans le nouveau fichier "kuwo.py", vous devez d'abord importer les modules nécessaires :

import scrapy
from kuwo_music.items import KuwoMusicItem
from scrapy_redis.spiders import RedisSpider
from scrapy_redis import get_redis_from_settings
from scrapy.utils.project import get_project_settings

Copier après la connexion

Grâce au code ci-dessus, nous pouvons utiliser différentes classes d'outils fournies par Scrapy cadre et méthodes, ainsi que des modules personnalisés dans le projet. Avant de continuer à écrire le code du robot, nous devons d'abord analyser la page Web où se trouvent les informations sur la chanson Kugou Music.

Ouvrez le navigateur, visitez www.kuwo.cn, entrez le nom de la chanson dans la barre de recherche et effectuez une recherche, vous constaterez que la page Web passe à la page des résultats de recherche. Dans la page des résultats de recherche, vous pouvez voir des informations pertinentes sur chaque chanson, telles que le nom de la chanson, l'artiste, la durée de lecture, etc. Nous devons envoyer une demande via Scrapy et analyser la page de résultats de recherche pour obtenir les détails de chaque chanson.

Dans le code du programme de robot d'exploration, nous devons implémenter les deux méthodes suivantes :

def start_requests(self):
    ...
    
def parse(self, response):
    ...

Copier après la connexion

Parmi elles, la méthode start_requests() est utilisée pour envoyer la requête initiale de page Web, et la méthode d'analyse parse() est désignée comme rappel function; tandis que la méthode parse() est utilisée pour analyser les pages Web, extraire des données et traiter les réponses. Le code spécifique est le suivant :

class KuwoSpider(RedisSpider):
    name = 'kuwo'
    allowed_domains = ['kuwo.cn']
    redis_cli = get_redis_from_settings(get_project_settings())

    def start_requests(self):
        keywords = ['爱情', '妳太善良', '说散就散']
        # 搜索结果页面的url
        for keyword in keywords:
            url = f'http://www.kuwo.cn/search/list?key={keyword}&rformat=json&ft=music&encoding=utf8&rn=8&pn=1'
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        data = json.loads(response.text)
        # 获取搜索结果页面的每个歌曲信息
        song_list = data['data']['list']
        for song in song_list:
            music_id = song['musicrid'][6:]
            song_name = song['name']
            singer_name = song['artist']
            album_name = song['album']

            # 根据歌曲id获取歌曲详细信息
            url = f'http://www.kuwo.cn/url?format=mp3&rid=MUSIC_{music_id}&response=url&type=convert_url3&br=128kmp3&from=web&t=1639056420390&httpsStatus=1&reqId=6be77da1-4325-11ec-b08e-11263642326e'
            meta = {'song_name': song_name, 'singer_name': singer_name, 'album_name': album_name}
            yield scrapy.Request(url=url, callback=self.parse_song, meta=meta)

    def parse_song(self, response):
        item = KuwoMusicItem()
        item['song_name'] = response.meta.get('song_name')
        item['singer_name'] = response.meta.get('singer_name')
        item['album_name'] = response.meta.get('album_name')
        item['song_url'] = response.text.strip()
        yield item

Copier après la connexion

Dans le code ci-dessus, nous définissons d'abord les mots-clés de la chanson à rechercher dans la méthode start_requests(), construisons l'URL de chaque page de résultats de recherche de chanson et envoyons la requête. Dans la méthode parse(), nous analysons la page de résultats de recherche et extrayons les informations pertinentes sur chaque chanson, notamment le nom de la chanson, l'artiste, l'album, etc. Ensuite, sur la base de l'identifiant de chaque chanson, nous construisons une URL pour obtenir les informations sur la chanson correspondante et utilisons le mécanisme de métadonnées (méta) de Scrapy pour transférer le nom de la chanson, le chanteur, l'album et d'autres informations. Enfin, nous analysons la page d'informations sur la chanson, extrayons l'adresse de lecture de la chanson dans la méthode parse_song(), et la transmettons à l'objet KuwoMusicItem personnalisé.

5. Stockage et utilisation des données

Dans le code ci-dessus, nous définissons un objet KuwoMusicItem personnalisé pour stocker les informations sur la chanson analysée. Nous pouvons utiliser la classe d'outils RedisPipeline pour stocker les données analysées dans la base de données Redis :

ITEM_PIPELINES = {
    'kuwo_music.pipelines.RedisPipeline': 300,
}

Copier après la connexion

En même temps, nous pouvons également utiliser la classe d'outils JsonLinesItemExporter pour stocker les données dans un fichier csv local :

from scrapy.exporters import JsonLinesItemExporter
import csv

class CsvPipeline(object):
    # 将数据存储到csv文件
    def __init__(self):
        self.file = open('kuwo_music.csv', 'w', encoding='utf-8', newline='')
        self.exporter = csv.writer(self.file)
        self.exporter.writerow(['song_name', 'singer_name', 'album_name', 'song_url'])

    def close_spider(self, spider):
        self.file.close()

    def process_item(self, item, spider):
        self.exporter.writerow([item['song_name'], item['singer_name'], item['album_name'], item['song_url']])
        return item

Copier après la connexion

Enfin, exécutez-le dans la ligne de commande La commande suivante peut démarrer le robot d'exploration Scrapy :

scrapy crawl kuwo

Copier après la connexion

Ce qui précède est une introduction détaillée sur la façon d'utiliser le framework Scrapy pour explorer les informations sur les chansons de Kugou Music. J'espère qu'il pourra vous fournir des références et de l'aide.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

<🎜>: Dead Rails - Comment relever chaque défi

4 Il y a quelques semaines By DDD

Guide de l'atomfall: emplacements des articles, guides de quête et conseils

4 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7673

Tutoriel CakePHP

1393

Tutoriel C#

1207

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

Afficher plus

Related knowledge

Instructions pour le renouvellement et l'annulation automatiques de l'adhésion à Kugou Music APP Mar 19, 2024 pm 07:28 PM

Comment annuler le renouvellement automatique de l'abonnement sur Kugou Music APP ? De nombreux utilisateurs ont demandé le service de renouvellement automatique VIP de Kugou Music. Plus tard, ils souhaitent annuler ce service, mais ils ne savent pas où l'annuler. Ci-dessous, je vais vous présenter un tutoriel sur la façon d'annuler le service. -renouvellement de Kugou Music J'espère que cela sera utile à tout le monde. Il est très simple d'annuler le renouvellement automatique dans Kugou Music APP : entrez simplement dans le centre des membres, recherchez le forfait musical/l'option VIP de luxe, sélectionnez le renouvellement automatique activé, puis cliquez pour fermer le renouvellement. 2. WeChat : Comme le montre l'image ci-dessous, accédez à la page de paiement, cliquez sur les trois points dans le coin supérieur droit, sélectionnez le service de déduction, cliquez sur Kugou Music pour fermer le service 3. Alipay : Accédez à la page des paramètres, sélectionnez les paramètres de paiement, puis sélectionnez Paiement sans mot de passe/Déduire automatiquement les frais, et enfin choisissez Kugou Music pour résilier le contrat.

Comment désactiver Viper Panorama dans Kugou Music Étapes pour désactiver Viper Panorama. Mar 12, 2024 pm 03:00 PM

Le logiciel de l'application Kugou Music propose un grand nombre de chansons musicales, toutes officiellement autorisées. Vous pouvez les écouter à tout moment et en tout lieu, toutes sont gratuites en permanence sur demande, et les belles chansons résonnent dans vos oreilles. Il prend en charge les téléchargements en ligne pour les utilisateurs de téléphones mobiles de différents systèmes. Vous pouvez vous connecter en saisissant votre compte et votre mot de passe. Les œuvres musicales de différents styles sont gratuites en entrant le titre de la chanson en un seul clic. différents modes d'effet sonore, rendant l'atmosphère d'écoute globale plus immersive. Vous pouvez également désactiver l'effet sonore panoramique vipère et vous pouvez librement découvrir le mode d'écoute dans d'autres situations, personnaliser et créer des listes de lecture musicales exclusives, partager des liens musicaux en ligne et complètement. Libérez votre humeur. Désormais, l'éditeur apportera des détails aux utilisateurs de Kugou Music en ligne. Étapes pour désactiver Viper Atmos. 1. Ouvrez Kugou Music et entrez dans le royaume principal de Kugou Music

Étapes simples pour télécharger votre propre musique sur Kugou Mar 25, 2024 pm 10:56 PM

1. Ouvrez Kugou Music et cliquez sur votre photo de profil. 2. Cliquez sur l'icône des paramètres dans le coin supérieur droit. 3. Cliquez sur [Télécharger des œuvres musicales]. 4. Cliquez sur [Télécharger les travaux]. 5. Sélectionnez la chanson et cliquez sur [Suivant]. 6. Enfin, cliquez sur [Télécharger].

Kugou Music peut se connecter à plusieurs appareils Apr 08, 2024 pm 05:15 PM

1. Un compte d'adhésion Kugou Music peut être utilisé sur un maximum de [cinq appareils], y compris les téléphones mobiles, les ordinateurs, les tablettes, etc. 2. Cependant, le même compte ne peut être utilisé que sur [deux appareils] en même temps et pendant la même période. 3. Lorsqu'un troisième appareil se connecte en même temps, le premier appareil se déconnecte automatiquement.

Comment annuler le renouvellement automatique de Kugou Music Mar 25, 2024 pm 04:33 PM

1. Ouvrez l'application Kugou Music, cliquez sur [Mon], sélectionnez [Centre des membres] et accédez à l'interface du centre des membres. 2. Cliquez sur [Paramètres des membres] en bas de l'interface et désactivez le commutateur [Renouvellement automatique]. 3. Cliquez sur le bouton [OK] dans la fenêtre contextuelle pour confirmer que le renouvellement automatique est désactivé. 4. À ce stade, l'utilisateur a désactivé avec succès la fonction de renouvellement automatique de l'abonnement de Kugou Music.

Comment définir le chemin de téléchargement pour Kugou Music Apr 07, 2024 pm 06:30 PM

Kugou Music est un logiciel de lecture de musique populaire, et sa fonction de téléchargement de chansons est également très populaire parmi les utilisateurs. Cependant, lorsqu'une mise en cache est nécessaire, de nombreux utilisateurs peuvent ne pas savoir comment définir le répertoire de téléchargement des chansons, ce qui rend difficile la gestion et la recherche des fichiers musicaux téléchargés. Alors, comment modifier l'emplacement de téléchargement dans Kugou Music ? Le guide didacticiel suivant vous fournira une introduction détaillée aux étapes de modification de l'emplacement du cache. J'espère que cela pourra aider ceux qui ne le savent pas encore. Comment définir le chemin de téléchargement pour Kugou Music 1. Ouvrez l'application Kugou Music et cliquez sur Mon dans le coin inférieur droit. 2. Cliquez sur l'icône des trois lignes horizontales dans le coin supérieur droit. 3. Cliquez sur le répertoire de téléchargement de chansons et entrez les paramètres.

Logiciel gratuit pour écouter de la musique sur votre ordinateur Apr 03, 2024 pm 01:04 PM

Existe-t-il un logiciel de musique capable de lire toutes les chansons gratuitement ? Un logiciel d'écoute de chansons peut écouter toutes les chansons gratuitement sur Kugou Music, QQ Music, NetEase Cloud Music, Migu Music et Kuwo Music. « Kugou Music » : En tant que l'un des premiers logiciels de musique, Kugou Music propose de nombreux contenus passionnants, quel que soit le type de morceaux que vous souhaitez écouter, écouter de la musique est un bon moyen de se détendre. Le logiciel "KuWo Music" contient un nombre relativement important de morceaux de certains programmes musicaux très populaires. Tous les téléchargements sont gratuits. La qualité sonore est très garantie et a donc été très populaire au fil des années. "Love Music" est un logiciel d'écoute de musique gratuit très pratique. Il y aura ici une gamme complète de chansons originales que les utilisateurs pourront rechercher librement en fonction de leurs préférences, et il y en aura également des dédiées.

Comment télécharger Kugou Music sur votre ordinateur local Tutoriel sur la façon de télécharger Kugou Music sur votre ordinateur local. Mar 28, 2024 pm 01:20 PM

Kugou Music peut nous aider à soulager l'ennui dans notre vie quotidienne. Nous pouvons écouter de nombreuses bonnes chansons, en particulier certaines chansons d'émissions de variétés au cinéma et à la télévision. Tant que nous les recherchons, elles apparaîtront et tout le monde pourra les écouter. Comment télécharger les chansons que nous aimons écouter localement ? Beaucoup d'amis ne le savent pas, c'est pourquoi l'éditeur a simplement compilé un guide pour télécharger des chansons sur l'ordinateur local pour ceux qui sont intéressés. Venons-en sur ce site Web pour vérifier cela. guide. J’espère qu’il sera utile à tout le monde. Tutoriel pour télécharger Kugou Music sur votre ordinateur local 1. Ouvrez d'abord Kugou Music et cliquez sur la musique que vous souhaitez télécharger sur la page Kugou Music 2. Entrez ensuite dans la page de cette musique et cliquez sur [l'icône à trois points] dans ; le coin inférieur droit ; 3. Après avoir cliqué

See all articles