Le robot d'exploration Python analyse la critique du film 'Wolf Warrior'-Linux-php.cn

Maison

Tutoriel système

Linux

Le robot d'exploration Python analyse la critique du film 'Wolf Warrior'

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 05, 2024 pm 09:44 PM

linux linux教程红帽 linux系统 linux命令 certification Linux chapeau rouge Linux vidéo Linux

Présentation

Au 20 août, 25e jour de sa sortie, "Wolf Warrior II" avait rapporté plus de 5 milliards de yuans au box-office, devenant ainsi le seul film asiatique à entrer dans le top 100 du box-office de l'histoire du cinéma mondial. Cet article utilise des robots d'exploration Python pour obtenir des données, analyser les critiques de films Douban et créer une image cloud des critiques de films Douban. Voyons maintenant quels sous-textes intéressants se cachent dans les critiques de « Wolf Warrior II ».

Le robot dexploration Python analyse la critique du film Wolf Warrior

Mis à part le box-office explosif, le film a également suscité diverses émotions chez le public. Certaines personnes ont même dit durement : quiconque ose critiquer "Wolf Warrior II" est soit un retard mental, soit un ennemi public.
Tout le monde a des critiques mitigées sur "Wolf Warrior II" et a laissé des commentaires sur Douban pour exprimer son opinion sur le film. Bien que divers commentaires aient été publiés et que les médias aient fait tout un plat, le public ne pouvait toujours pas dire quelle opinion était la plus fiable.

Jusqu'à présent, il y a eu plus de 150 000 commentaires. Lorsque vous lisez les commentaires, vous pouvez voir la plupart d'entre eux pendant un certain temps, soit des commentaires élogieux, soit des commentaires désobligeants. Il est donc difficile de dire en parcourant les commentaires quelle est l’opinion globale de chacun sur ce film. Utilisons maintenant l’analyse des données pour voir quelles choses intéressantes se sont produites dans ces commentaires !

Cet article utilise un robot d'exploration Python pour obtenir des données, analyser les critiques de films Douban et créer une image cloud des critiques de films Douban. Voyons maintenant quels sous-textes intéressants se cachent dans les critiques de « Wolf Warrior II ».

Acquisition de données

Cet article utilise les données obtenues par le robot d'exploration Python. Il utilise principalement le package de requêtes et le package régulier re. Ce programme ne traite pas le code de vérification. J'ai déjà exploré la page Web de Douban. À cette époque, le contenu exploré étant petit, je n'ai pas rencontré le code de vérification. Lorsque j'ai écrit ce robot, je pensais qu'il n'y aurait pas de code de vérification, mais lorsqu'environ 15 000 commentaires ont été explorés, le code de vérification est apparu.
Puis j’ai pensé : n’est-ce pas seulement 120 000 ? Tout au plus, je n’ai saisi le code de vérification qu’une douzaine de fois, je n’ai donc pas eu à m’occuper du code de vérification. Mais ce qui s'est passé ensuite m'a un peu dérouté. Lorsque j'ai exploré environ 15 000 commentaires et saisi le code de vérification, j'ai pensé qu'il en explorerait environ 30 000, mais après en avoir exploré environ 3 000, cela n'a pas fonctionné. le code de vérification. .

Ensuite, cela a continué comme ça, en trébuchant. Parfois, il fallait beaucoup de temps pour explorer avant qu'un code de vérification soit nécessaire, et parfois ce n'était pas le cas. Mais finalement, les commentaires ont été explorés. Le contenu exploré comprend principalement : le nom de l'utilisateur, si vous l'avez vu, le nombre d'étoiles du commentaire, l'heure du commentaire, le nombre de personnes qui l'ont trouvé utile et le contenu du commentaire. Voici le code du robot Python :
demandes d'importation importer re importer des pandas en tant que PD url_first='https://movie.douban.com/subject/26363254/comments?start=0' head={'User-Agent':'Mozilla/5.0 (X11 ; Linux x86_64) AppleWebKit/537.36 (KHTML, comme Gecko) Ubuntu Chromium/59.0.3071.109 Chrome/59.0.3071.109 Safari/537.36'} html=requests.get(url_first,headers=head,cookies=cookies) cookies={'cookie':'your own cookie'} #C'est-à-dire, trouvez le cookie correspondant à votre compte reg=re.compile(r'') #Page suivante ren=re.compile(r'(.*?).*?comment">(.*?).*?.*?(.*?).*?(.*?).* ?title="(.*?)">.*?title="(.*?)">.*?class=""> (.*?)n',re.S) #Commentaires et autres contenus tandis que html.status_code==200: url_next='https://movie.douban.com/subject/26363254/comments'+re.findall(reg,html.text)[0] zhanlang=re.findall(ren,html.text) data=pd.DataFrame(zhanlang) data.to_csv('/home/wajuejiprince/document/zhanlang/zhanlangpinglun.csv', header=False,index=False,mode='a+') #Écrivez un fichier csv, 'a+' est le mode d'ajout données=[] zhanlang=[] html=requests.get(url_next,cookies=cookies,headers=head)
Dans le code ci-dessus, veuillez définir votre propre agent utilisateur, cookie, chemin d'enregistrement CSV, etc., et enregistrez le contenu analysé dans un fichier au format CSV.

Nettoyage des données

Cet article utilise le langage R pour traiter les données. Bien que nous ayons accordé une grande attention à la structure du contenu analysé lors de l'exploration, il est inévitable que certaines valeurs ne correspondent pas à ce que nous voulons. Par exemple, certains contenus de commentaires apparaîtront dans l'élément commentateur, il est donc toujours nécessaire de nettoyer les données.

Chargez d'abord tous les packages que vous souhaitez utiliser :
bibliothèque (data.table) bibliothèque (intrigue) bibliothèque (stringr) bibliothèque (jiebaR) bibliothèque (wordcloud2) bibliothèque(magrittr)
Importer des données et nettoyer :
dt

Analyse des données

Regardons d'abord les commentaires en fonction du nombre d'étoiles :
plot_ly(my_dt[,.(.N),by=.(五星数)],type = 'bar',x=~五星数,y=~N)plot_ly(my_dt[,.(.N),by=.(numéro cinq étoiles)],type = 'bar',x=~numéro cinq étoiles,y=~N)
Le robot dexploration Python analyse la critique du film Wolf Warrior

🎜

Le nombre d'étoiles à cinq branches correspond à 5 niveaux, 5 étoiles signifie fortement recommandé, 4 étoiles signifie recommandé, 3 étoiles signifie bien, 2 étoiles signifie mauvais et 1 étoile signifie très mauvais.
Il ressort clairement des critiques de Pentagram que nous avons des raisons de croire que la grande majorité des téléspectateurs seront satisfaits de ce film.

Nous devons d'abord segmenter les commentaires :
semaine Affichage global du cloud : <code>mots%data.table() définir des noms (mots, "N", "pinshu") mots[pinshu>1000] #Supprimer les mots de fréquence inférieure (moins de 1000) wordcloud2 (mots [pinshu> 1000], taille = 2, fontFamily = "Microsoft Yahei", couleur = "lumière aléatoire", backgroundColor = "gris")
Parce qu'il y avait trop de données, mon ordinateur en panne s'est figé, j'ai donc supprimé les mots avec des fréquences inférieures à 1 000 lors de la création de la carte nuageuse. Les résultats de l'image cloud sont les suivants :
Le robot dexploration Python analyse la critique du film Wolf Warrior

Dans l’ensemble, les commentaires de tout le monde sur cette vidéo sont plutôt bons ! Des sujets tels que l'intrigue, l'action et le patriotisme sont au centre des discussions.

Mots-clés d'évaluation : Wu Jing, héroïsme personnel, thème principal, Chine, aura du protagoniste, secrétaire Dakang, très brûlant.

On peut voir que « brûler » n'est pas la réponse la plus populaire après l'avoir regardé. Le public est plus intéressé à admirer Wu Jing lui-même et à commenter le patriotisme et l'individualisme.

Affichage d'images cloud avec différents niveaux de commentaires

Mais à quoi cela ressemblerait-il si les commentaires des personnes ayant des notes différentes étaient affichés séparément ? Il s'agit de créer un graphique cloud pour le contenu de l'examen à cinq niveaux (fortement recommandé, recommandé, d'accord, mauvais, très mauvais), le code est le suivant (il suffit de changer le code en "fortement recommandé" par un autre).

1. Nuage de commentaires de critiques hautement recommandés

Le robot dexploration Python analyse la critique du film Wolf Warrior

2. Nuage de commentaires des évaluateurs recommandés

Le robot dexploration Python analyse la critique du film Wolf Warrior

3. Nuage d'avis de bons évaluateurs

Le robot dexploration Python analyse la critique du film Wolf Warrior

4. Nuage d'avis de mauvais évaluateurs

Le robot dexploration Python analyse la critique du film Wolf Warrior

5. Nuage d'avis de mauvais évaluateurs

Le robot dexploration Python analyse la critique du film Wolf Warrior

Conclusion

À en juger par les résultats de segmentation des mots des différents commentaires, ils ont tous un sujet commun : le patriotisme.

Le nombre de sujets patriotiques dans les commentaires fortement recommandés peut être plus élevé que dans les commentaires peu recommandés. Dans les commentaires fortement recommandés, les gens sont plus disposés à discuter d'autres sujets que des sujets patriotiques. La plupart des commentaires négatifs concernaient des sujets patriotiques. Et leur proportion est très intéressante De ceux qui le recommandent fortement à ceux qui commentent mal, la proportion de sujets patriotiques augmente progressivement.

Nous ne pouvons pas penser subjectivement qui a raison ou tort. Nous pouvons seulement dire qu'ils ont des perspectives différentes, donc les résultats qu'ils voient sont également différents. Lorsque nous ne sommes pas d’accord avec les autres, nous avons souvent des points de vue différents. Les personnes qui font de mauvais commentaires pensent peut-être davantage à des sujets patriotiques (il ne s’agit que d’une discussion sur des sujets patriotiques, pas sur ceux qui aiment ou n’aiment pas le pays) ! !

Après l'analyse, la raison fondamentale pour laquelle ce "Wolf Warrior 2" a été soutenu par tant de gens est qu'il a atteint en production une scène de niveau blockbuster américain que "Wolf Warrior 1" n'avait pas, et en même temps cela a suscité le patriotisme et a éveillé le cœur des gens.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

1 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Où trouver la courte de la grue à atomide atomique

1 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7432

Tutoriel CakePHP

1359

Quel est le format du nom de compte de Steam

Clé d&#39;activation Win11 permanent

Afficher plus

Related knowledge

Entrée de la version Web Deepseek Entrée du site officiel Deepseek Feb 19, 2025 pm 04:54 PM

Deepseek est un puissant outil de recherche et d'analyse intelligent qui fournit deux méthodes d'accès: la version Web et le site officiel. La version Web est pratique et efficace et peut être utilisée sans installation; Que ce soit des individus ou des utilisateurs d'entreprise, ils peuvent facilement obtenir et analyser des données massives via Deepseek pour améliorer l'efficacité du travail, aider la prise de décision et promouvoir l'innovation.

Comment installer Deepseek Feb 19, 2025 pm 05:48 PM

Il existe de nombreuses façons d'installer Deepseek, notamment: Compiler à partir de Source (pour les développeurs expérimentés) en utilisant des packages précompilés (pour les utilisateurs de Windows) à l'aide de conteneurs Docker (pour le plus pratique, pas besoin de s'inquiéter de la compatibilité), quelle que soit la méthode que vous choisissez, veuillez lire Les documents officiels documentent soigneusement et les préparent pleinement à éviter des problèmes inutiles.

Comment résoudre le problème des autorisations rencontré lors de la visualisation de la version Python dans le terminal Linux? Apr 01, 2025 pm 05:09 PM

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Installation officielle du site officiel de Bitget (Guide du débutant 2025) Feb 21, 2025 pm 08:42 PM

Bitget est un échange de crypto-monnaie qui fournit une variété de services de trading, notamment le trading au comptant, le trading de contrats et les dérivés. Fondée en 2018, l'échange est basée à Singapour et s'engage à fournir aux utilisateurs une plate-forme de trading sûre et fiable. Bitget propose une variété de paires de trading, notamment BTC / USDT, ETH / USDT et XRP / USDT. De plus, l'échange a une réputation de sécurité et de liquidité et offre une variété de fonctionnalités telles que les types de commandes premium, le trading à effet de levier et le support client 24/7.

Obtenez le package d'installation Gate.io gratuitement Feb 21, 2025 pm 08:21 PM

Gate.io est un échange de crypto-monnaie populaire que les utilisateurs peuvent utiliser en téléchargeant son package d'installation et en l'installant sur leurs appareils. Les étapes pour obtenir le package d'installation sont les suivantes: Visitez le site officiel de Gate.io, cliquez sur "Télécharger", sélectionnez le système d'exploitation correspondant (Windows, Mac ou Linux) et téléchargez le package d'installation sur votre ordinateur. Il est recommandé de désactiver temporairement les logiciels antivirus ou le pare-feu pendant l'installation pour assurer une installation fluide. Une fois terminé, l'utilisateur doit créer un compte Gate.io pour commencer à l'utiliser.

Le package d'installation OUYI OKX est directement inclus Feb 21, 2025 pm 08:00 PM

OUYI OKX, le premier échange mondial d'actifs numériques, a maintenant lancé un package d'installation officiel pour offrir une expérience de trading sûre et pratique. Le package d'installation OKX de OUYI n'a pas besoin d'être accessible via un navigateur. Le processus d'installation est simple et facile à comprendre.

Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système? Mar 31, 2025 pm 11:54 PM

Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système. Chaque fois que le système redémarre, nous devons exécuter la commande suivante pour modifier les autorisations d'UnixSocket: sudo ...

OUYI Exchange Télécharger le portail officiel Feb 21, 2025 pm 07:51 PM

Ouyi, également connu sous le nom d'OKX, est une plate-forme de trading de crypto-monnaie de pointe. L'article fournit un portail de téléchargement pour le package d'installation officiel d'Ouyi, qui facilite les utilisateurs pour installer le client Ouyi sur différents appareils. Ce package d'installation prend en charge les systèmes Windows, Mac, Android et iOS. Une fois l'installation terminée, les utilisateurs peuvent s'inscrire ou se connecter au compte OUYI, commencer à négocier des crypto-monnaies et profiter d'autres services fournis par la plate-forme.

See all articles