Lernpfad „Python für die Datenanalyse'.
Im Einführungskapitel wird ein Beispiel für die Verarbeitung des MovieLens 1M-Datensatzes vorgestellt. Das Buch stellt vor, dass der Datensatz von GroupLens Research () stammt, zu dem direkt auf die Website von MovieLens gesprungen wird. Dort können Sie auch das entsprechende komprimierte Paket von MovieLens 1M herunterladen . In.
Der heruntergeladene und dekomprimierte Ordner lautet wie folgt:
Diese drei Datentabellen werden im Beispiel verwendet. Die chinesische Version (PDF) von „Python For Data Analysis“, die ich gelesen habe, ist die erste Ausgabe im Jahr 2014. Alle darin enthaltenen Beispiele basieren auf Python 2.7 und Pandas 0.8.2, und ich habe Python 3.5.2 und Pandas 0.8 installiert. 2. Pandas 0.20.2, einige davon sind Parameter, die in der neuen Version geändert wurden, und einige sind in der neuen Version veraltet. Dies hat dazu geführt, dass ich den Beispielcode im Buch ausgeführt habe , werden Sie auf einige Fehler und Warnungen stoßen. Beim Testen des MovieLens 1M-Datensatzcodes in derselben Konfigurationsumgebung wie bei mir treten die folgenden Probleme auf.
-
Beim Einlesen von Daten in ein Pandas-DataFrame-Objekt lautet der im Buch angegebene Code:
users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames) rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames) mnames = ['movie_id', 'title', 'genres'] movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames)
Nach dem Login kopierenBeim direkten Ausführen erscheint eine Warnung:
F:/python/HelloWorld/DataAnalysisByPython-1.py:4: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'. users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames) F:/python/HelloWorld/DataAnalysisByPython-1.py:7: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'. ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames) F:/python/HelloWorld/DataAnalysisByPython-1.py:10: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'. movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames)
Nach dem Login kopierenObwohl es auch ausgeführt werden kann, als perfekte Zwangsstörung Störung, ich möchte diese Warnung immer noch lösen. Diese Warnung bedeutet, dass die „C“-Engine dies nicht unterstützt und daher nur auf die „Python“-Engine zurückgreifen kann. Außerdem gibt es in der Methode pandas.read_table einen Engine-Parameter, der zum Festlegen der Parsing-Engine verwendet wird Zu verwenden, einschließlich 'C' und 'Python' Diese beiden Optionen. Da die „C“-Engine dies nicht unterstützt, müssen wir die Engine nur auf „Python“ setzen.
users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames, engine = 'python') rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames, engine = 'python') mnames = ['movie_id', 'title', 'genres'] movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames, engine = 'python')
Nach dem Login kopieren -
Verwenden Sie die Methode „pivot_table“, um den Durchschnitt jedes Films nach Geschlecht anhand der aggregierten Daten zu berechnen Score, der im Buch angegebene Code lautet:
mean_ratings = data.pivot_table('rating', rows='title', cols='gender', aggfunc='mean')
Nach dem Login kopierenWenn Sie ihn direkt ausführen, wird ein Fehler gemeldet. Dieser Code kann nicht ausgeführt werden:
Traceback (most recent call last): File "F:/python/HelloWorld/DataAnalysisByPython-1.py", line 19, in <module>mean_ratings = data.pivot_table('rating', rows='title', cols='gender', aggfunc='mean') TypeError: pivot_table() got an unexpected keyword argument 'rows'
Nach dem Login kopierenTypeError zeigt an, dass der Parameter „rows“ hier kein in der Methode verfügbarer Schlüsselwortparameter ist. Was ist los? Ich habe die Dokumentation zur Verwendung der Pandas-API auf der offiziellen Website () überprüft und festgestellt, dass dies daran liegt, dass sich die Schlüsselwortparameter in pandas.pivot_table in Version 0.20.2 geändert haben. Um den gleichen Effekt zu erzielen, ersetzen Sie einfach die Zeilen durch den Index. und es gibt keinen cols-Parameter, also verwenden Sie stattdessen Spalten.
mean_ratings = data.pivot_table('rating', index='title', columns='gender', aggfunc='mean')
Nach dem Login kopieren - Um die Lieblingsfilme des weiblichen Publikums zu verstehen, verwenden Sie die DataFrame-Methode zur Durchführung Spalte F Sortiert in absteigender Reihenfolge, der Beispielcode im Buch lautet: Dies gibt nur eine Warnung aus und beeinträchtigt das Programm nicht:
top_female_ratings = mean_ratings.sort_index(by='F', ascending=False)
Nach dem Login kopierenHier wird gesagt, dass sich die sort_index-Methode zum Sortieren in Zukunft in der Sprache oder Bibliothek ändern kann, und es wird empfohlen, sort_values zu verwenden stattdessen. In der Dokumentation zur API-Nutzung lautet die Beschreibung von pandas.DataFrame.sort_index „Objekt nach Beschriftungen sortieren (entlang einer Achse)“, während die Beschreibung von pandas.DataFrame.sort_values „Nach Werten entlang einer Achse sortieren“ lautet. . Beide können den gleichen Effekt erzielen, dann werde ich es einfach durch sort_values ersetzen. Sort_index wird auch im folgenden „F:/python/HelloWorld/DataAnalysisByPython-1.py:32: FutureWarning: by argument to sort_index is deprecated, pls use .sort_values(by=...) top_female_ratings = mean_ratings.sort_index(by='F', ascending=False)
Nach dem Login kopierenScore-Differenz berechnen“ verwendet und kann auch durch sort_values ersetzt werden.
top_female_ratings = mean_ratings.sort_values(by='F', ascending=False)
Nach dem Login kopieren - Der letzte Fehler betrifft immer noch die Sortierung. Nachdem Sie die Standardabweichung der Score-Daten in „
Score-Divergenz berechnen“ berechnet haben, sortieren Sie die Reihe in absteigender Reihenfolge basierend auf dem gefilterten Wert. Der Code im Buch lautet:
这里的错误是:
Traceback (most recent call last): File "F:/python/HelloWorld/DataAnalysisByPython-1.py", line 47, in <module>print(rating_std_by_title.order(ascending=False)[:10]) File "E:\Program Files\Python35\lib\site-packages\pandas\core\generic.py", line 2970, in __getattr__return object.__getattribute__(self, name) AttributeError: 'Series' object has no attribute 'order'
Nach dem Login kopieren居然已经没有这个order的方法了,只好去API文档中找替代的方法用。有两个,sort_index和sort_values,这和DataFrame中的方法一样,为了保险起见,我选择使用sort_values:
print(rating_std_by_title.sort_values(ascending=False)[:10]
Nach dem Login kopieren得到的结果和数据展示的结果一样,可以放心使用。
第三方库不同版本间的差异还是挺明显的,建议是使用最新的版本,在使用时配合官网网站上的API使用文档,轻松解决各类问题~
Das obige ist der detaillierte Inhalt vonLernpfad „Python für die Datenanalyse'.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



PHP eignet sich für Webentwicklung und schnelles Prototyping, und Python eignet sich für Datenwissenschaft und maschinelles Lernen. 1.PHP wird für die dynamische Webentwicklung verwendet, mit einfacher Syntax und für schnelle Entwicklung geeignet. 2. Python hat eine kurze Syntax, ist für mehrere Felder geeignet und ein starkes Bibliotheksökosystem.

PHP ist hauptsächlich prozedurale Programmierung, unterstützt aber auch die objektorientierte Programmierung (OOP). Python unterstützt eine Vielzahl von Paradigmen, einschließlich OOP, funktionaler und prozeduraler Programmierung. PHP ist für die Webentwicklung geeignet, und Python eignet sich für eine Vielzahl von Anwendungen wie Datenanalyse und maschinelles Lernen.

VS -Code kann unter Windows 8 ausgeführt werden, aber die Erfahrung ist möglicherweise nicht großartig. Stellen Sie zunächst sicher, dass das System auf den neuesten Patch aktualisiert wurde, und laden Sie dann das VS -Code -Installationspaket herunter, das der Systemarchitektur entspricht und sie wie aufgefordert installiert. Beachten Sie nach der Installation, dass einige Erweiterungen möglicherweise mit Windows 8 nicht kompatibel sind und nach alternativen Erweiterungen suchen oder neuere Windows -Systeme in einer virtuellen Maschine verwenden müssen. Installieren Sie die erforderlichen Erweiterungen, um zu überprüfen, ob sie ordnungsgemäß funktionieren. Obwohl VS -Code unter Windows 8 möglich ist, wird empfohlen, auf ein neueres Windows -System zu upgraden, um eine bessere Entwicklungserfahrung und Sicherheit zu erzielen.

VS -Code kann zum Schreiben von Python verwendet werden und bietet viele Funktionen, die es zu einem idealen Werkzeug für die Entwicklung von Python -Anwendungen machen. Sie ermöglichen es Benutzern: Installation von Python -Erweiterungen, um Funktionen wie Code -Abschluss, Syntax -Hervorhebung und Debugging zu erhalten. Verwenden Sie den Debugger, um Code Schritt für Schritt zu verfolgen, Fehler zu finden und zu beheben. Integrieren Sie Git für die Versionskontrolle. Verwenden Sie Tools für die Codeformatierung, um die Codekonsistenz aufrechtzuerhalten. Verwenden Sie das Lining -Tool, um potenzielle Probleme im Voraus zu erkennen.

VS -Code -Erweiterungen stellen böswillige Risiken dar, wie das Verstecken von böswilligem Code, das Ausbeutetieren von Schwachstellen und das Masturbieren als legitime Erweiterungen. Zu den Methoden zur Identifizierung böswilliger Erweiterungen gehören: Überprüfung von Verlegern, Lesen von Kommentaren, Überprüfung von Code und Installation mit Vorsicht. Zu den Sicherheitsmaßnahmen gehören auch: Sicherheitsbewusstsein, gute Gewohnheiten, regelmäßige Updates und Antivirensoftware.

Im VS -Code können Sie das Programm im Terminal in den folgenden Schritten ausführen: Erstellen Sie den Code und öffnen Sie das integrierte Terminal, um sicherzustellen, dass das Codeverzeichnis mit dem Terminal Working -Verzeichnis übereinstimmt. Wählen Sie den Befehl aus, den Befehl ausführen, gemäß der Programmiersprache (z. B. Pythons Python your_file_name.py), um zu überprüfen, ob er erfolgreich ausgeführt wird, und Fehler auflösen. Verwenden Sie den Debugger, um die Debugging -Effizienz zu verbessern.

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

VS -Code ist auf Mac verfügbar. Es verfügt über leistungsstarke Erweiterungen, GIT -Integration, Terminal und Debugger und bietet auch eine Fülle von Setup -Optionen. Für besonders große Projekte oder hoch berufliche Entwicklung kann VS -Code jedoch Leistung oder funktionale Einschränkungen aufweisen.
