So lesen Sie CSV-Dateien mit der Pandas-Bibliothek

WBOY
Freigeben: 2024-01-04 10:08:34
Original
1456 Leute haben es durchsucht

So lesen Sie CSV-Dateien mit der Pandas-Bibliothek

So lesen Sie CSV-Dateien mit Pandas

Übersicht:
CSV (Comma-Separated Values) ist ein gängiges Tabellenkalkulationsdateiformat, das Kommas oder andere spezifische Zeichen als Trennzeichen für Feldwerte verwendet. Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, die verschiedene Datendateien, einschließlich CSV-Dateien, einfach lesen, verarbeiten und analysieren kann. In diesem Artikel wird die Verwendung der Pandas-Bibliothek zum Lesen von CSV-Dateien vorgestellt und spezifische Codebeispiele gegeben.

Schritte:

  1. Importieren Sie die erforderlichen Bibliotheken

    import pandas as pd
    Nach dem Login kopieren

    Zuerst müssen wir die Pandas-Bibliothek importieren.

  2. Lesen Sie die CSV-Datei mit der Funktion read_csv von Pandas

    data = pd.read_csv('file_path.csv')
    Nach dem Login kopieren

    In diesem Schritt verwenden wir die Funktion read_csv, um die CSV-Datei zu lesen. Sie müssen file_path.csv durch den Pfad und Dateinamen Ihrer tatsächlichen Datei ersetzen. Diese Funktion lädt den Dateiinhalt in ein DataFrame-Objekt namens data.

Wenn das Feldtrennzeichen in der CSV-Datei kein Komma, sondern andere Zeichen ist, können Sie den Parameter sep verwenden, um das Trennzeichen festzulegen. Wenn das Trennzeichen beispielsweise ein Semikolon ist, lautet der Code wie folgt:

data = pd.read_csv('file_path.csv', sep=';')
Nach dem Login kopieren
  1. Anzeigen von Daten

    print(data.head())
    Nach dem Login kopieren

    Mithilfe der Head-Funktion können wir die ersten paar Zeilen des Datensatzes ausdrucken, um die Daten anzuzeigen Inhalt. Der Standardparameter der Head-Funktion ist 5, was bedeutet, dass die ersten fünf Datenzeilen ausgedruckt werden sollen.

  2. Verarbeiten von Daten
    Sobald die Daten in das DataFrame-Objekt eingelesen wurden, können wir die verschiedenen von Pandas bereitgestellten Funktionen und Methoden verwenden, um die Daten zu verarbeiten. Hier sind einige Beispiele:
  • Zeigen Sie die Abmessungen der Daten an (Anzahl der Zeilen und Spalten).

    print(data.shape)
    Nach dem Login kopieren

    Das Shape-Attribut kann die Dimensionsinformationen des DataFrame zurückgeben, z. B. (Anzahl der Zeilen, Anzahl der Spalten).

  • Spaltennamen anzeigen

    print(data.columns)
    Nach dem Login kopieren

    columns-Eigenschaft kann die Spaltennamenliste von DataFrame zurückgeben.

  • Statistische Zusammenfassung der Daten anzeigen

    print(data.describe())
    Nach dem Login kopieren

    Die Beschreibungsfunktion kann die statistische Zusammenfassung der Daten zurückgeben, einschließlich Mittelwert, Standardabweichung, Minimalwert, Maximalwert usw.

  • Daten filtern
    Zum Beispiel können wir Daten filtern, um eine Teilmenge der Daten unter bestimmten Bedingungen zu erhalten:

    filtered_data = data[data['column_name'] > 10]
    Nach dem Login kopieren

    Im obigen Beispiel haben wir Daten mit einem Wert größer als 10 im Spaltennamen „Spaltenname“ herausgefiltert.

  • Daten sortieren

    sorted_data = data.sort_values(by='column_name', ascending=True)
    Nach dem Login kopieren

    Mit der Funktion sort_values ​​​​können wir die Daten sortieren, nach dem angegebenen Spaltennamen sortieren und eine aufsteigende oder absteigende Reihenfolge festlegen.

  • Daten speichern

    data.to_csv('new_file_path.csv', index=False)
    Nach dem Login kopieren

    to_csv-Funktion kann das DataFrame-Objekt als neue CSV-Datei speichern. Sie müssen new_file_path.csv durch den Dateinamen und Pfad ersetzen, den Sie tatsächlich speichern möchten. Der Parameter index=False gibt an, dass der Index der Daten nicht gespeichert wird.

  • Zusammenfassung:
    Dieser Artikel stellt die Schritte zur Verwendung von Pandas zum Lesen von CSV-Dateien vor und gibt spezifische Codebeispiele. Pandas bietet eine Fülle von Funktionen und Methoden, mit denen sich Daten einfach verarbeiten und analysieren lassen. Durch die Verwendung dieser Funktionen können wir die Daten in CSV-Dateien besser nutzen.

    Das obige ist der detaillierte Inhalt vonSo lesen Sie CSV-Dateien mit der Pandas-Bibliothek. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage