Maison > développement back-end > Tutoriel Python > Robot d'exploration Python super simple pour télécharger NetEase Cloud Music

Robot d'exploration Python super simple pour télécharger NetEase Cloud Music

不言
Libérer: 2018-08-29 11:57:05
original
4606 Les gens l'ont consulté

Le contenu de cet article concerne le téléchargement de NetEase Cloud Music à l'aide d'un robot Python super simple. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer.

Objectif

Par hasard, j'ai entendu "Clouds and Smoke Turn into Rain" de Landlady's Cat. J'ai été immédiatement fasciné par la voix paresseuse et les paroles étudiantes, puis j'ai continué à écouter. eux en boucle. Ensuite, j'ai délibérément regardé l'anime "Je suis Jiang Xiaobai", et j'ai vraiment hâte de voir la deuxième saison...

Je veux vous revoir, même si je dois partir après juste un rapide coup d'œil...

D'accord, pas de bêtises. L'objectif cette fois est de télécharger les paroles et l'audio de la musique populaire du chanteur en fonction de l'identifiant du chanteur dans NetEase Cloud et de l'enregistrer dans un dossier local.

Bases de la configuration

  • Python

  • Selenium (se référer à la méthode de configuration : configuration Selenium)

  • Navigateur Chrome (d'autres sont également disponibles et doivent être modifiés en conséquence)

Analyse

Si des amis qui ont exploré le site Web de NetEase Cloud vous ont Il faut savoir que NetEase Cloud dispose d'un mécanisme anti-exploration Lors du POST, vous devez simuler la fonction de cryptage de certains paramètres d'informations. Mais ici, par souci de simplicité, les novices peuvent le comprendre. Selenium est utilisé directement pour simuler la connexion, puis l'interface est utilisée pour télécharger directement de la musique et des paroles.

Étapes expérimentales :

  1. Obtenez la liste des chansons populaires du chanteur, les noms des chansons et les liens en fonction de l'identifiant du chanteur, et enregistrez-les dans un fichier CSV fichier ;

  2. Lisez le fichier csv, extrayez l'ID de la chanson en fonction du lien de la chanson, puis utilisez l'interface correspondante pour télécharger la musique et les paroles

  3. Mettez la musique et enregistrez les paroles localement.

Robot dexploration Python super simple pour télécharger NetEase Cloud Music

Implémentation de Python

Cette section présentera plusieurs fonctions clés...

Obtenir des informations sur le chanteur

En utilisant Selenium, nous n'avons pas besoin de lire la demande de la page Web, nous pouvons directement extraire les informations correspondantes du code source de la page Web. En regardant le code source de la page du chanteur, nous pouvons constater que les informations dont nous avons besoin se trouvent dans le cadre iframe, nous devons donc d'abord passer à l'iframe :

browser.switch_to.frame('contentFrame')
Copier après la connexion
Continuez la lecture et constatez que la chanson le nom et le lien dont nous avons besoin sont dans la balise

, et chaque ligne correspond à une balise id="hotsong-list". Alors récupérez d’abord tout le contenu tr, puis parcourez un seul tr. tr

data = browser.find_element_by_id("hotsong-list").find_elements_by_tag_name("tr")
Copier après la connexion
Remarque : le premier est

, le second est find_element et le second renvoie une liste. find_elements

L'étape suivante consiste à analyser le contenu d'une seule balise

et à obtenir le nom et le lien de la chanson. Vous pouvez constater que les deux se trouvent dans la balise tr et que le lien est le class="txt". attribut et le nom est l'attribut href. Il peut être obtenu directement via la fonction title. get_attribute()

Robot dexploration Python super simple pour télécharger NetEase Cloud Music

for i in range(len(data)):
    content = data[i].find_element_by_class_name("txt")
    href = content.find_element_by_tag_name("a").get_attribute("href")
    title = content.find_element_by_tag_name("b").get_attribute("title")
    song_info.append((title, href))
Copier après la connexion
Télécharger les paroles

NetEase Cloud a une interface pour obtenir les paroles, le lien est : http://music .163.com/api/song...

Le numéro dans le lien est l'identifiant de la chanson, donc après avoir obtenu l'identifiant de la chanson, nous pouvons télécharger les paroles directement à partir du lien. le format

, nous avons donc besoin du package json. json

Robot dexploration Python super simple pour télécharger NetEase Cloud Music

De plus, dans les paroles obtenues directement, chaque ligne a une chronologie, qui doit être éliminée à l'aide d'expressions régulières. Le code complet est le suivant. :

def get_lyric(self):
    url = 'http://music.163.com/api/song/lyric?' + 'id=' + str(self.song_id) + '&lv=1&kv=1&tv=-1'
    r = requests.get(url)
    json_obj = r.text
    j = json.loads(json_obj)
    lyric = j['lrc']['lyric']
    # 利用正则表达式去除时间轴
    regex = re.compile(r'\[.*\]')
    final_lyric = re.sub(regex, '', lyric)
    return final_lyric
Copier après la connexion
Télécharger l'audio

NetEase Cloud fournit également une interface pour les fichiers audio, le lien est : http://music.163.com/song/med...

Lien Le numéro est l'identifiant de la chanson, et le fichier audio peut être téléchargé directement en fonction de l'identifiant de la chanson. Le code complet est le suivant :

def get_mp3(self):
    url = 'http://music.163.com/song/media/outer/url?id=' + str(self.song_id)+'.mp3'
    try:
        print("正在下载:{0}".format(self.song_name))
        urllib.request.urlretrieve(url, '{0}/{1}.mp3'.format(self.path, self.song_name))
        print("Finish...")
    except:
        print("Fail...")
Copier après la connexion
Recommandations associées :

Comment utiliser Python pour explorer les commentaires populaires sur NetEase Cloud Music

Exemple du processus d'exploration de musique qq avec Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal