Heim System-Tutorial LINUX Python-Crawler analysiert die Filmkritik zu „Wolf Warrior'.

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior'.

Jan 05, 2024 pm 09:44 PM
linux linux教程 红帽 linux系统 linux命令 Linux-Zertifizierung Red Hat Linux Linux-Video

Einführung Seit dem 20. August, dem 25. Tag seiner Veröffentlichung, hat „Wolf Warrior II“ mehr als 5 Milliarden Yuan an den Kinokassen eingespielt und ist damit wirklich der einzige asiatische Film, der es in der Weltfilmgeschichte in die Top 100 der Kinokassen geschafft hat. In diesem Artikel werden Python-Crawler verwendet, um Daten abzurufen, Douban-Filmrezensionen zu analysieren und ein Cloud-Image der Douban-Filmrezensionen zu erstellen. Werfen wir nun einen Blick darauf, welche interessanten Untertexte sich in den Rezensionen zu „Wolf Warrior II“ verbergen.

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

Abgesehen von den explosiven Einspielergebnissen löste der Film auch verschiedene Emotionen beim Publikum aus. Einige Leute sagten sogar harsch: Wer es wagt, „Wolf Warrior II“ zu kritisieren, ist entweder geistig zurückgeblieben oder ein Staatsfeind.
Jeder hat gemischte Kritiken zu „Wolf Warrior II“ abgegeben und Kommentare zu Douban hinterlassen, um seine Meinung zum Film zu äußern. Obwohl verschiedene Kommentare veröffentlicht wurden und die Medien viel Aufhebens machten, konnte das Publikum immer noch nicht sagen, welche Meinung verlässlicher war.

Bisher gab es mehr als 150.000 Kommentare. Wenn Sie die Kommentare lesen, sehen Sie möglicherweise für einen bestimmten Zeitraum entweder lobende oder abwertende Kommentare. Daher ist es schwierig, anhand der Kommentare zu sagen, wie die allgemeine Meinung aller zu diesem Film ist. Lassen Sie uns nun mithilfe der Datenanalyse herausfinden, welche interessanten Dinge in diesen Kommentaren passiert sind!

Dieser Artikel verwendet einen Python-Crawler, um Daten abzurufen, Douban-Filmrezensionen zu analysieren und ein Cloud-Image der Douban-Filmrezensionen zu erstellen. Werfen wir nun einen Blick darauf, welche interessanten Untertexte sich in den Rezensionen zu „Wolf Warrior II“ verbergen.

Datenerfassung

Dieser Artikel verwendet die vom Python-Crawler erhaltenen Daten. Er verwendet hauptsächlich das Anforderungspaket und das reguläre Paket re. Dieses Programm verarbeitet den Bestätigungscode nicht. Ich habe Doubans Webseite schon einmal gecrawlt. Da der gecrawlte Inhalt damals klein war, bin ich nicht auf den Bestätigungscode gestoßen. Als ich diesen Crawler schrieb, dachte ich, dass es keinen Bestätigungscode geben würde, aber als etwa 15.000 Kommentare gecrawlt wurden, tauchte der Bestätigungscode auf.
Dann dachte ich, sind es nicht nur 120.000? Ich habe den Bestätigungscode höchstens etwa ein Dutzend Mal eingegeben, sodass ich mich nicht mit dem Bestätigungscode herumschlagen musste. Aber was als nächstes passierte, war für mich etwas verwirrend. Als ich etwa 15.000 Kommentare durchsuchte und den Bestätigungscode eingab, dachte ich, dass es etwa 30.000 sein würden, aber nachdem ich etwa 3.000 gecrawlt hatte, musste ich immer noch den eingeben Bestätigungscode. .

Dann ging es einfach weiter und stolperte herum. Manchmal dauerte es lange, bis ein Bestätigungscode benötigt wurde, und manchmal auch nicht. Aber am Ende wurden die Kommentare gecrawlt. Der gecrawlte Inhalt umfasst hauptsächlich: Benutzername, ob Sie ihn gesehen haben, die Anzahl der Sterne des Kommentars, die Zeit des Kommentars, die Anzahl der Personen, die ihn nützlich fanden, und den Inhalt des Kommentars. Das Folgende ist der Code des Python-Crawlers:
Anfragen importieren<br> re<br> importieren Pandas als PD importieren<br> url_first='https://movie.douban.com/subject/26363254/comments?start=0'<br> head={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/59.0.3071.109 Chrome/59.0.3071.109 Safari/537.36'}<br> html=requests.get(url_first,headers=head,cookies=cookies)<br> Cookies={'Cookie':'Ihr eigenes Cookie'} #Das heißt, finden Sie das Cookie, das Ihrem Konto entspricht<br> reg=re.compile(r'') #Nächste Seite<br> ren=re.compile(r'<span>(.*?)</span>.*?comment">(.*?).*?.*?<span .>(.*?).*?<span>(.*?)</span>.* ?title="(.*?)"></span>.*?title="(.*?)">.*?class=""> (.*?)n',re.S) #Kommentare und andere Inhalte <br> während html.status_code==200:<br> url_next='https://movie.douban.com/subject/26363254/comments'+re.findall(reg,html.text)[0]<br> zhanlang=re.findall(ren,html.text)<br> data=pd.DataFrame(zhanlang)<br> data.to_csv('/home/wajuejiprince/document/zhanlang/zhanlangpinglun.csv', header=False,index=False,mode='a+') #Schreiben Sie eine CSV-Datei, 'a+' ist der Anhängemodus<br> data=[]<br> zhanlang=[]<br> html=requests.get(url_next,cookies=cookies,headers=head)
Legen Sie im obigen Code bitte Ihren eigenen Benutzeragenten, Cookie, CSV-Speicherpfad usw. fest und speichern Sie den gecrawlten Inhalt in einer Datei im CSV-Format.

Datenbereinigung

Dieser Artikel verwendet die R-Sprache zum Verarbeiten von Daten. Obwohl wir beim Crawlen großen Wert auf die Struktur des gecrawlten Inhalts gelegt haben, ist es unvermeidlich, dass es einige Werte gibt, die nicht unseren Wünschen entsprechen. Beispielsweise werden einige Kommentarinhalte im Kommentatorelement angezeigt, sodass die Daten weiterhin bereinigt werden müssen.

Laden Sie zunächst alle Pakete, die Sie verwenden möchten:
Bibliothek(data.table)<br> Bibliothek(plotly)<br> Bibliothek(stringr)<br> Bibliothek(jiebaR)<br> Bibliothek(wordcloud2)<br> Bibliothek(magrittr)
Daten importieren und bereinigen:
dt

Datenanalyse

Schauen wir uns zunächst die Kommentare anhand der Anzahl der Sterne an:
plot_ly(my_dt[,.(.N),by=.(五星数)],type = 'bar',x=~五星数,y=~N)plot_ly(my_dt[,.(.N),by=.(Fünf-Sterne-Zahl)],type = 'bar',x=~Fünf-Sterne-Zahl,y=~N)
Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

🎜

Die Anzahl der fünfzackigen Sterne entspricht 5 Stufen, 5 Sterne bedeuten sehr empfehlenswert, 4 Sterne bedeuten empfohlen, 3 Sterne bedeuten okay, 2 Sterne bedeuten schlecht und 1 Stern bedeutet sehr schlecht.
Aus den Kritiken zu Pentagram geht hervor, dass wir Grund zu der Annahme haben, dass die überwiegende Mehrheit der Zuschauer mit diesem Film zufrieden sein wird.

Zuerst sollten wir die Kommentare segmentieren:
Woche <br> Gesamtbewertung der Wolkenanzeige: <br> <code>Wörter%data.table()<br> setnames(words, „N“, „pinshu“)<br> Wörter[pinshu>1000] #Entferne Wörter mit geringerer Häufigkeit (weniger als 1000)<br> wordcloud2(words[pinshu>1000], size = 2, fontFamily = „Microsoft Yahei“, color = „random-light“, backgroundColor = „grey“)
Da zu viele Daten vorhanden waren, fror mein kaputter Computer ein, sodass ich bei der Erstellung des Wolkendiagramms Wörter mit Häufigkeiten unter 1.000 entfernte. Die Ergebnisse des Wolkenbildes lauten wie folgt:
Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

Alle Kommentare zu diesem Video sind insgesamt ziemlich gut! Themen wie Handlung, Action und Patriotismus stehen im Mittelpunkt der Diskussion.

Bewertungsschlüsselwörter: Wu Jing, persönlicher Heldentum, Hauptthema, China, Aura des Protagonisten, Sekretär Dakang, sehr brennend.

Man sieht, dass „Brennen“ nicht die beliebteste Reaktion nach dem Anschauen ist. Das Publikum ist mehr daran interessiert, Wu Jing selbst zu bewundern und Patriotismus und Individualismus zu kommentieren.

Wolkenbildanzeige mit verschiedenen Kommentarebenen

Aber wie würde es aussehen, wenn die Kommentare von Personen mit unterschiedlichen Bewertungen separat angezeigt würden? Das heißt, ein Wolkendiagramm für den Überprüfungsinhalt von fünf Ebenen zu erstellen (dringend empfohlen, empfohlen, in Ordnung, schlecht, sehr schlecht). Der Code lautet wie folgt (ändern Sie einfach den Code in „dringend empfohlen“ in „Andere“).

1. Kommentarwolke mit sehr empfehlenswerten Rezensenten

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

2. Kommentarwolke empfohlener Rezensenten

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

3. Bewertungswolke guter Rezensenten

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

4. Bewertungswolke schlechter Rezensenten

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

5. Bewertungswolke schlechter Rezensenten

Python-Crawler analysiert die Filmkritik zu „Wolf Warrior.

Fazit

Den Wortsegmentierungsergebnissen verschiedener Kommentare nach zu urteilen, haben sie alle ein gemeinsames Thema: Patriotismus.

Die Anzahl patriotischer Themen in sehr empfohlenen Kommentaren kann höher sein als in schlecht empfohlenen Kommentaren. In sehr empfohlenen Kommentaren sind die Leute eher bereit, über andere Dinge als patriotische Themen zu diskutieren. Die meisten negativen Kommentare betrafen patriotische Themen. Und ihr Anteil ist sehr interessant: Von denen, die es wärmstens empfehlen, bis hin zu denen, die schlechte Kritiken haben, nimmt der Anteil patriotischer Themen allmählich zu.

Wir können nicht subjektiv darüber nachdenken, wer Recht oder Unrecht hat. Wir können nur sagen, dass sie aus unterschiedlichen Perspektiven stehen, daher sind auch die Ergebnisse, die sie sehen, unterschiedlich. Wenn wir mit anderen nicht einverstanden sind, vertreten wir oft unterschiedliche Perspektiven. Leute mit schlechten Kommentaren denken möglicherweise mehr über patriotische Themen nach (dies ist nur eine Diskussion über patriotische Themen, nicht darüber, wer das Land liebt oder nicht mag)! !

Nach der Analyse ist der Hauptgrund, warum dieser „Wolf Warrior 2“ von so vielen Menschen unterstützt wurde, dass er in der Produktion eine Szene auf amerikanischem Blockbuster-Niveau erreicht hat, die „Wolf Warrior 1“ nicht hatte, und gleichzeitig Es hat den Patriotismus geweckt und die Herzen der Menschen erweckt.

Das obige ist der detaillierte Inhalt vonPython-Crawler analysiert die Filmkritik zu „Wolf Warrior'.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Unterschied zwischen CentOS und Ubuntu Unterschied zwischen CentOS und Ubuntu Apr 14, 2025 pm 09:09 PM

Die wichtigsten Unterschiede zwischen CentOS und Ubuntu sind: Ursprung (CentOS stammt von Red Hat, für Unternehmen; Ubuntu stammt aus Debian, für Einzelpersonen), Packungsmanagement (CentOS verwendet yum, konzentriert sich auf Stabilität; Ubuntu verwendet apt, für hohe Aktualisierungsfrequenz), Support Cycle (Centos) (CENTOS bieten 10 Jahre. Tutorials und Dokumente), Verwendungen (CentOS ist auf Server voreingenommen, Ubuntu ist für Server und Desktops geeignet). Weitere Unterschiede sind die Einfachheit der Installation (CentOS ist dünn)

So installieren Sie CentOs So installieren Sie CentOs Apr 14, 2025 pm 09:03 PM

CentOS -Installationsschritte: Laden Sie das ISO -Bild herunter und verbrennen Sie bootfähige Medien. Starten und wählen Sie die Installationsquelle; Wählen Sie das Layout der Sprache und Tastatur aus. Konfigurieren Sie das Netzwerk; Partition die Festplatte; Setzen Sie die Systemuhr; Erstellen Sie den Root -Benutzer; Wählen Sie das Softwarepaket aus; Starten Sie die Installation; Starten Sie nach Abschluss der Installation von der Festplatte neu und starten Sie von der Festplatte.

CentOS 'Wahl nach der Beendigung der Wartung CentOS 'Wahl nach der Beendigung der Wartung Apr 14, 2025 pm 08:51 PM

CentOS wurde eingestellt, Alternativen umfassen: 1. Rocky Linux (beste Kompatibilität); 2. Almalinux (kompatibel mit CentOS); 3. Ubuntu Server (Konfiguration erforderlich); 4. Red Hat Enterprise Linux (kommerzielle Version, bezahlte Lizenz); 5. Oracle Linux (kompatibel mit CentOS und RHEL). Bei der Migration sind Überlegungen: Kompatibilität, Verfügbarkeit, Unterstützung, Kosten und Unterstützung in der Gemeinde.

Detaillierte Erklärung des Docker -Prinzips Detaillierte Erklärung des Docker -Prinzips Apr 14, 2025 pm 11:57 PM

Docker verwendet Linux -Kernel -Funktionen, um eine effiziente und isolierte Anwendungsumgebung zu bieten. Sein Arbeitsprinzip lautet wie folgt: 1. Der Spiegel wird als schreibgeschützte Vorlage verwendet, die alles enthält, was Sie für die Ausführung der Anwendung benötigen. 2. Das Union File System (UnionFS) stapelt mehrere Dateisysteme, speichert nur die Unterschiede, speichert Platz und beschleunigt. 3. Der Daemon verwaltet die Spiegel und Container, und der Kunde verwendet sie für die Interaktion. 4. Namespaces und CGroups implementieren Container -Isolation und Ressourcenbeschränkungen; 5. Mehrere Netzwerkmodi unterstützen die Containerverbindung. Nur wenn Sie diese Kernkonzepte verstehen, können Sie Docker besser nutzen.

So verwenden Sie Docker Desktop So verwenden Sie Docker Desktop Apr 15, 2025 am 11:45 AM

Wie benutze ich Docker Desktop? Docker Desktop ist ein Werkzeug zum Ausführen von Docker -Containern auf lokalen Maschinen. Zu den zu verwendenden Schritten gehören: 1.. Docker Desktop installieren; 2. Start Docker Desktop; 3.. Erstellen Sie das Docker -Bild (mit Dockerfile); 4. Build Docker Image (mit Docker Build); 5. Docker -Container ausführen (mit Docker Run).

Was zu tun ist, nachdem CentOS die Wartung gestoppt hat Was zu tun ist, nachdem CentOS die Wartung gestoppt hat Apr 14, 2025 pm 08:48 PM

Nachdem CentOS gestoppt wurde, können Benutzer die folgenden Maßnahmen ergreifen, um sich damit zu befassen: Wählen Sie eine kompatible Verteilung aus: wie Almalinux, Rocky Linux und CentOS Stream. Migrieren Sie auf kommerzielle Verteilungen: wie Red Hat Enterprise Linux, Oracle Linux. Upgrade auf CentOS 9 Stream: Rolling Distribution und bietet die neueste Technologie. Wählen Sie andere Linux -Verteilungen aus: wie Ubuntu, Debian. Bewerten Sie andere Optionen wie Container, virtuelle Maschinen oder Cloud -Plattformen.

Welche Computerkonfiguration ist für VSCODE erforderlich? Welche Computerkonfiguration ist für VSCODE erforderlich? Apr 15, 2025 pm 09:48 PM

VS Code system requirements: Operating system: Windows 10 and above, macOS 10.12 and above, Linux distribution processor: minimum 1.6 GHz, recommended 2.0 GHz and above memory: minimum 512 MB, recommended 4 GB and above storage space: minimum 250 MB, recommended 1 GB and above other requirements: stable network connection, Xorg/Wayland (Linux)

Was tun, wenn das Docker -Bild fehlschlägt? Was tun, wenn das Docker -Bild fehlschlägt? Apr 15, 2025 am 11:21 AM

Fehlerbehebung Schritte für fehlgeschlagene Docker -Bild Build: Überprüfen Sie die Dockerfile -Syntax und die Abhängigkeitsversion. Überprüfen Sie, ob der Build -Kontext den erforderlichen Quellcode und die erforderlichen Abhängigkeiten enthält. Sehen Sie sich das Build -Protokoll für Fehlerdetails an. Verwenden Sie die Option -Target -Option, um eine hierarchische Phase zu erstellen, um Fehlerpunkte zu identifizieren. Verwenden Sie die neueste Version von Docker Engine. Erstellen Sie das Bild mit--t [Bildname]: Debugg-Modus, um das Problem zu debuggen. Überprüfen Sie den Speicherplatz und stellen Sie sicher, dass dies ausreicht. Deaktivieren Sie Selinux, um eine Störung des Build -Prozesses zu verhindern. Fragen Sie Community -Plattformen um Hilfe, stellen Sie Dockerfiles an und erstellen Sie Protokollbeschreibungen für genauere Vorschläge.

See all articles