Heim Backend-Entwicklung Python-Tutorial Lernpfad „Python für die Datenanalyse'.

Lernpfad „Python für die Datenanalyse'.

Jun 23, 2017 pm 04:25 PM
analysis data for python 学习 笔记

Im Einführungskapitel wird ein Beispiel für die Verarbeitung des MovieLens 1M-Datensatzes vorgestellt. Das Buch stellt vor, dass der Datensatz von GroupLens Research () stammt, zu dem direkt auf die Website von MovieLens gesprungen wird. Dort können Sie auch das entsprechende komprimierte Paket von MovieLens 1M herunterladen . In.

Der heruntergeladene und dekomprimierte Ordner lautet wie folgt:

Diese drei Datentabellen werden im Beispiel verwendet. Die chinesische Version (PDF) von „Python For Data Analysis“, die ich gelesen habe, ist die erste Ausgabe im Jahr 2014. Alle darin enthaltenen Beispiele basieren auf Python 2.7 und Pandas 0.8.2, und ich habe Python 3.5.2 und Pandas 0.8 installiert. 2. Pandas 0.20.2, einige davon sind Parameter, die in der neuen Version geändert wurden, und einige sind in der neuen Version veraltet. Dies hat dazu geführt, dass ich den Beispielcode im Buch ausgeführt habe , werden Sie auf einige Fehler und Warnungen stoßen. Beim Testen des MovieLens 1M-Datensatzcodes in derselben Konfigurationsumgebung wie bei mir treten die folgenden Probleme auf.

  • Beim Einlesen von Daten in ein Pandas-DataFrame-Objekt lautet der im Buch angegebene Code:

    users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames)
    
    rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
    ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames)
    
    mnames = ['movie_id', 'title', 'genres']
    movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames)
    Nach dem Login kopieren

    Beim direkten Ausführen erscheint eine Warnung:

    F:/python/HelloWorld/DataAnalysisByPython-1.py:4: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.
      users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames)
    F:/python/HelloWorld/DataAnalysisByPython-1.py:7: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.
      ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames)
    F:/python/HelloWorld/DataAnalysisByPython-1.py:10: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.
      movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames)
    Nach dem Login kopieren

    Obwohl es auch ausgeführt werden kann, als perfekte Zwangsstörung Störung, ich möchte diese Warnung immer noch lösen. Diese Warnung bedeutet, dass die „C“-Engine dies nicht unterstützt und daher nur auf die „Python“-Engine zurückgreifen kann. Außerdem gibt es in der Methode pandas.read_table einen Engine-Parameter, der zum Festlegen der Parsing-Engine verwendet wird Zu verwenden, einschließlich 'C' und 'Python' Diese beiden Optionen. Da die „C“-Engine dies nicht unterstützt, müssen wir die Engine nur auf „Python“ setzen.

    users = pd.read_table('ml-1m/users.dat', sep='::', header=None, names=unames, engine = 'python')
    
    rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
    ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header=None, names=rnames, engine = 'python')
    
    mnames = ['movie_id', 'title', 'genres']
    movies = pd.read_table('ml-1m/movies.dat', sep='::', header=None, names=mnames, engine = 'python')
    Nach dem Login kopieren

  • Verwenden Sie die Methode „pivot_table“, um den Durchschnitt jedes Films nach Geschlecht anhand der aggregierten Daten zu berechnen Score, der im Buch angegebene Code lautet:

    mean_ratings = data.pivot_table('rating', rows='title', cols='gender', aggfunc='mean')
    Nach dem Login kopieren

    Wenn Sie ihn direkt ausführen, wird ein Fehler gemeldet. Dieser Code kann nicht ausgeführt werden:

    Traceback (most recent call last):
      File "F:/python/HelloWorld/DataAnalysisByPython-1.py", line 19, in <module>mean_ratings = data.pivot_table('rating', rows='title', cols='gender', aggfunc='mean')
    TypeError: pivot_table() got an unexpected keyword argument 'rows'
    Nach dem Login kopieren

    TypeError zeigt an, dass der Parameter „rows“ hier kein in der Methode verfügbarer Schlüsselwortparameter ist. Was ist los? Ich habe die Dokumentation zur Verwendung der Pandas-API auf der offiziellen Website () überprüft und festgestellt, dass dies daran liegt, dass sich die Schlüsselwortparameter in pandas.pivot_table in Version 0.20.2 geändert haben. Um den gleichen Effekt zu erzielen, ersetzen Sie einfach die Zeilen durch den Index. und es gibt keinen cols-Parameter, also verwenden Sie stattdessen Spalten.

    mean_ratings = data.pivot_table('rating', index='title', columns='gender', aggfunc='mean')
    Nach dem Login kopieren

  • Um die Lieblingsfilme des weiblichen Publikums zu verstehen, verwenden Sie die DataFrame-Methode zur Durchführung Spalte F Sortiert in absteigender Reihenfolge, der Beispielcode im Buch lautet:

    top_female_ratings = mean_ratings.sort_index(by='F', ascending=False)
    Nach dem Login kopieren
    Dies gibt nur eine Warnung aus und beeinträchtigt das Programm nicht:

    F:/python/HelloWorld/DataAnalysisByPython-1.py:32: FutureWarning: by argument to sort_index is deprecated, pls use .sort_values(by=...)
      top_female_ratings = mean_ratings.sort_index(by='F', ascending=False)
    Nach dem Login kopieren
    Hier wird gesagt, dass sich die sort_index-Methode zum Sortieren in Zukunft in der Sprache oder Bibliothek ändern kann, und es wird empfohlen, sort_values ​​​​zu verwenden stattdessen. In der Dokumentation zur API-Nutzung lautet die Beschreibung von pandas.DataFrame.sort_index „Objekt nach Beschriftungen sortieren (entlang einer Achse)“, während die Beschreibung von pandas.DataFrame.sort_values ​​​​​​„Nach Werten entlang einer Achse sortieren“ lautet. . Beide können den gleichen Effekt erzielen, dann werde ich es einfach durch sort_values ​​ersetzen. Sort_index wird auch im folgenden „

    Score-Differenz berechnen“ verwendet und kann auch durch sort_values ​​ersetzt werden.

    top_female_ratings = mean_ratings.sort_values(by='F', ascending=False)
    Nach dem Login kopieren

  • Der letzte Fehler betrifft immer noch die Sortierung. Nachdem Sie die Standardabweichung der Score-Daten in „

    Score-Divergenz berechnen“ berechnet haben, sortieren Sie die Reihe in absteigender Reihenfolge basierend auf dem gefilterten Wert. Der Code im Buch lautet:

    这里的错误是:

    Traceback (most recent call last):
      File "F:/python/HelloWorld/DataAnalysisByPython-1.py", line 47, in <module>print(rating_std_by_title.order(ascending=False)[:10])
      File "E:\Program Files\Python35\lib\site-packages\pandas\core\generic.py", line 2970, in __getattr__return object.__getattribute__(self, name)
    AttributeError: 'Series' object has no attribute 'order'
    Nach dem Login kopieren

    居然已经没有这个order的方法了,只好去API文档中找替代的方法用。有两个,sort_index和sort_values,这和DataFrame中的方法一样,为了保险起见,我选择使用sort_values:

    print(rating_std_by_title.sort_values(ascending=False)[:10]
    Nach dem Login kopieren

    得到的结果和数据展示的结果一样,可以放心使用。

    第三方库不同版本间的差异还是挺明显的,建议是使用最新的版本,在使用时配合官网网站上的API使用文档,轻松解决各类问题~

Das obige ist der detaillierte Inhalt vonLernpfad „Python für die Datenanalyse'.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wählen Sie zwischen PHP und Python: Ein Leitfaden Wählen Sie zwischen PHP und Python: Ein Leitfaden Apr 18, 2025 am 12:24 AM

PHP eignet sich für Webentwicklung und schnelles Prototyping, und Python eignet sich für Datenwissenschaft und maschinelles Lernen. 1.PHP wird für die dynamische Webentwicklung verwendet, mit einfacher Syntax und für schnelle Entwicklung geeignet. 2. Python hat eine kurze Syntax, ist für mehrere Felder geeignet und ein starkes Bibliotheksökosystem.

PHP und Python: Verschiedene Paradigmen erklärt PHP und Python: Verschiedene Paradigmen erklärt Apr 18, 2025 am 12:26 AM

PHP ist hauptsächlich prozedurale Programmierung, unterstützt aber auch die objektorientierte Programmierung (OOP). Python unterstützt eine Vielzahl von Paradigmen, einschließlich OOP, funktionaler und prozeduraler Programmierung. PHP ist für die Webentwicklung geeignet, und Python eignet sich für eine Vielzahl von Anwendungen wie Datenanalyse und maschinelles Lernen.

Kann gegen Code in Windows 8 ausgeführt werden Kann gegen Code in Windows 8 ausgeführt werden Apr 15, 2025 pm 07:24 PM

VS -Code kann unter Windows 8 ausgeführt werden, aber die Erfahrung ist möglicherweise nicht großartig. Stellen Sie zunächst sicher, dass das System auf den neuesten Patch aktualisiert wurde, und laden Sie dann das VS -Code -Installationspaket herunter, das der Systemarchitektur entspricht und sie wie aufgefordert installiert. Beachten Sie nach der Installation, dass einige Erweiterungen möglicherweise mit Windows 8 nicht kompatibel sind und nach alternativen Erweiterungen suchen oder neuere Windows -Systeme in einer virtuellen Maschine verwenden müssen. Installieren Sie die erforderlichen Erweiterungen, um zu überprüfen, ob sie ordnungsgemäß funktionieren. Obwohl VS -Code unter Windows 8 möglich ist, wird empfohlen, auf ein neueres Windows -System zu upgraden, um eine bessere Entwicklungserfahrung und Sicherheit zu erzielen.

Kann Visual Studio -Code in Python verwendet werden Kann Visual Studio -Code in Python verwendet werden Apr 15, 2025 pm 08:18 PM

VS -Code kann zum Schreiben von Python verwendet werden und bietet viele Funktionen, die es zu einem idealen Werkzeug für die Entwicklung von Python -Anwendungen machen. Sie ermöglichen es Benutzern: Installation von Python -Erweiterungen, um Funktionen wie Code -Abschluss, Syntax -Hervorhebung und Debugging zu erhalten. Verwenden Sie den Debugger, um Code Schritt für Schritt zu verfolgen, Fehler zu finden und zu beheben. Integrieren Sie Git für die Versionskontrolle. Verwenden Sie Tools für die Codeformatierung, um die Codekonsistenz aufrechtzuerhalten. Verwenden Sie das Lining -Tool, um potenzielle Probleme im Voraus zu erkennen.

Ist die VSCODE -Erweiterung bösartig? Ist die VSCODE -Erweiterung bösartig? Apr 15, 2025 pm 07:57 PM

VS -Code -Erweiterungen stellen böswillige Risiken dar, wie das Verstecken von böswilligem Code, das Ausbeutetieren von Schwachstellen und das Masturbieren als legitime Erweiterungen. Zu den Methoden zur Identifizierung böswilliger Erweiterungen gehören: Überprüfung von Verlegern, Lesen von Kommentaren, Überprüfung von Code und Installation mit Vorsicht. Zu den Sicherheitsmaßnahmen gehören auch: Sicherheitsbewusstsein, gute Gewohnheiten, regelmäßige Updates und Antivirensoftware.

So führen Sie Programme in der terminalen VSCODE aus So führen Sie Programme in der terminalen VSCODE aus Apr 15, 2025 pm 06:42 PM

Im VS -Code können Sie das Programm im Terminal in den folgenden Schritten ausführen: Erstellen Sie den Code und öffnen Sie das integrierte Terminal, um sicherzustellen, dass das Codeverzeichnis mit dem Terminal Working -Verzeichnis übereinstimmt. Wählen Sie den Befehl aus, den Befehl ausführen, gemäß der Programmiersprache (z. B. Pythons Python your_file_name.py), um zu überprüfen, ob er erfolgreich ausgeführt wird, und Fehler auflösen. Verwenden Sie den Debugger, um die Debugging -Effizienz zu verbessern.

Python vs. JavaScript: Die Lernkurve und Benutzerfreundlichkeit Python vs. JavaScript: Die Lernkurve und Benutzerfreundlichkeit Apr 16, 2025 am 12:12 AM

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

Kann VSCODE für MAC verwendet werden Kann VSCODE für MAC verwendet werden Apr 15, 2025 pm 07:36 PM

VS -Code ist auf Mac verfügbar. Es verfügt über leistungsstarke Erweiterungen, GIT -Integration, Terminal und Debugger und bietet auch eine Fülle von Setup -Optionen. Für besonders große Projekte oder hoch berufliche Entwicklung kann VS -Code jedoch Leistung oder funktionale Einschränkungen aufweisen.

See all articles