Maison > Tutoriel système > Linux > le corps du texte

Utilisez Python pour explorer toutes les informations vidéo de la station B

王林
Libérer: 2024-02-19 23:45:35
avant
617 Les gens l'ont consulté

Je pense que tout le monde connaît Station B. En fait, il y a beaucoup de recherches sur le site d'exploration de Station B. Cependant, ce que je lis sur papier est finalement superficiel, et je sais bien que je dois le faire en détail, donc je suis ici. Au final, la quantité totale de données explorées était de 7,6 millions .

Préparation

Ouvrez d’abord la Station B, recherchez une vidéo sur la page d’accueil et cliquez dessus. Pour un fonctionnement normal, ouvrez les outils de développement. Cette fois, l'objectif est d'obtenir des informations vidéo en explorant l'API fournie par la station B sans analyser la page Web. La vitesse d'analyse de la page Web est trop lente et l'adresse IP est facilement bloquée.

Cochez l'option JS et appuyez sur F5 pour actualiser

Utilisez Python pour explorer toutes les informations vidéo de la station B

J'ai trouvé l'adresse de l'API

Utilisez Python pour explorer toutes les informations vidéo de la station B

Copiez-le, supprimez le contenu inutile et obtenez https://api.bilibili.com/x/web-interface/archive/stat?aid=15906633 Ouvrez-le avec un navigateur et vous obtiendrez les données json suivantes

.

Utilisez Python pour explorer toutes les informations vidéo de la station B

Codage pratique

D'accord, le code peut désormais être codé. Les données sont obtenues par itération continue via requête. Afin de rendre le robot d'exploration plus efficace, le multithreading peut être utilisé.

Code de base

Utilisez Python pour explorer toutes les informations vidéo de la station B

Exploration itérative

Utilisez Python pour explorer toutes les informations vidéo de la station B

La partie la plus importante de l'ensemble du projet comprend environ 20 lignes de code, ce qui est assez concis.

L'effet d'exécution est à peu près le suivant : le nombre correspond au nombre de liens qui ont été explorés. En fait, l'intégralité des informations du site peut être explorée en un ou deux jours.

Utilisez Python pour explorer toutes les informations vidéo de la station B

Quant à la façon de le traiter après l'exploration, cela dépend de vos préférences. Je l'enregistre d'abord sous forme de fichier csv, puis je le résume et l'insère dans la base de données.

Table de base de données

Utilisez Python pour explorer toutes les informations vidéo de la station B

Depuis que j'ai exploré ce contenu il y a quelques mois, les données sont en fait un peu en retard.

Quantité totale de données

Utilisez Python pour explorer toutes les informations vidéo de la station B

Vérifiez les dix vidéos les plus jouées

Utilisez Python pour explorer toutes les informations vidéo de la station B

Vérifiez les dix vidéos avec le plus de réponses

Utilisez Python pour explorer toutes les informations vidéo de la station B

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:linuxprobe.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!