Heim > Backend-Entwicklung > Python-Tutorial > Ein genauerer Blick auf die Pandas-Sortierung: Erstellen Sie eine geordnete Ansicht Ihrer Daten

Ein genauerer Blick auf die Pandas-Sortierung: Erstellen Sie eine geordnete Ansicht Ihrer Daten

WBOY
Freigeben: 2024-01-24 10:16:12
Original
663 Leute haben es durchsucht

Ein genauerer Blick auf die Pandas-Sortierung: Erstellen Sie eine geordnete Ansicht Ihrer Daten

Ausführliche Erklärung des Datenanalysetools Pandas Sorting: Sorgen Sie für Ordnung und eindrucksvolle Daten

Einführung: Im Prozess der Datenanalyse ist das Sortieren von Daten ein sehr häufiger und wichtiger Vorgang. Durch das Sortieren können die Daten geordnet und sichtbar gemacht werden, was uns die Analyse und Visualisierung der Daten erleichtert. In Python bietet die Pandas-Bibliothek leistungsstarke Sortierfunktionen. In diesem Artikel wird die Pandas-Sortiermethode ausführlich vorgestellt und spezifische Codebeispiele gegeben.

1. Grundkonzept der Sortierung
Bei der Datenanalyse kann die Sortierung in aufsteigender oder absteigender Reihenfolge nach einer bestimmten Spalte oder mehreren Spalten erfolgen. Dabei bedeutet aufsteigende Reihenfolge die Sortierung von klein nach groß und absteigende Reihenfolge bedeutet die Sortierung von groß nach klein.

2. Pandas-Sortiermethode
In Pandas gibt es zwei häufig verwendete Sortiermethoden: sort_values() und sort_index(). Die Methode

  1. sort_values()
    sort_values() wird zum Sortieren nach Wert verwendet, dh zum Sortieren nach dem numerischen Wert in der Spalte. Diese Methode hat die folgenden allgemeinen Parameter:
  • by: der zu sortierende Spaltenname, der ein einzelner Spaltenname oder eine Liste mit mehreren Spaltennamen sein kann.
  • aufsteigend: Sortiermethode, True bedeutet aufsteigende Reihenfolge, False bedeutet absteigende Reihenfolge, der Standardwert ist True.
  • inplace: Ob die Originaldaten geändert werden sollen. False bedeutet, dass eine neue sortierte Kopie der Daten erstellt wird. Die Methode
  1. sort_index()
    sort_index() wird zum Sortieren nach Index verwendet, d. h. zum Sortieren nach dem Index der Zeile. Diese Methode hat die folgenden allgemeinen Parameter:
  • axis: Achsenrichtung der Sortierung, 0 bedeutet Sortierung nach Zeilenindex, 1 bedeutet Sortierung nach Spaltenindex, der Standardwert ist 0.
  • aufsteigend: Sortiermethode, True bedeutet aufsteigende Reihenfolge, False bedeutet absteigende Reihenfolge, der Standardwert ist True.
  • inplace: Ob die Originaldaten geändert werden sollen. False bedeutet, dass eine neue sortierte Kopie der Daten erstellt wird.

3. Beispiel für die Sortierung von Pandas
Im Folgenden werden mehrere Beispiele verwendet, um die Sortierfunktion von Pandas zu demonstrieren.

  1. Nach einer einzelnen Spalte sortieren
    Angenommen, es gibt den folgenden Datensatz:
import pandas as pd

data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男']}
df = pd.DataFrame(data)
print(df)
Nach dem Login kopieren

Das Ausgabeergebnis ist:

     姓名  年龄 性别
0   Tom  20  男
1  Jerry  25  男
2  Spike  18  女
3   Tyke  30  男
Nach dem Login kopieren

Jetzt sortieren wir nach der Altersspalte in absteigender Reihenfolge:

df.sort_values(by='年龄', ascending=False, inplace=True)
print(df)
Nach dem Login kopieren

Das Ausgabeergebnis ist:

     姓名  年龄 性别
3   Tyke  30  男
1  Jerry  25  男
0   Tom  20  男
2  Spike  18  女
Nach dem Login kopieren
  1. Nach mehreren Spalten sortieren
    In manchen Fällen müssen wir möglicherweise nach mehreren Spalten sortieren. Angenommen, wir fügen den obigen Daten eine Spalte „Gehalt“ hinzu und sortieren nach Alter und Gehalt:
data = {'姓名': ['Tom', 'Jerry', 'Spike', 'Tyke'],
        '年龄': [20, 25, 18, 30],
        '性别': ['男', '男', '女', '男'],
        '工资': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
print(df)
Nach dem Login kopieren

Die Ausgabe lautet:

     姓名  年龄 性别   工资
0   Tom  20  男  5000
1  Jerry  25  男  6000
2  Spike  18  女  4000
3   Tyke  30  男  7000
Nach dem Login kopieren

Jetzt sortieren wir nach Alter und Gehalt in absteigender Reihenfolge:

df.sort_values(by=['年龄', '工资'], ascending=False, inplace=True)
print(df)
Nach dem Login kopieren

Die Ausgabe lautet:

     姓名  年龄 性别   工资
3   Tyke  30  男  7000
1  Jerry  25  男  6000
0   Tom  20  男  5000
2  Spike  18  女  4000
Nach dem Login kopieren
  1. Nach Zeilenindex sortieren
    Zusätzlich zur Sortierung nach Spalte können wir auch nach Zeilenindex sortieren. Angenommen, wir ändern den Zeilenindex der obigen Daten in ['c', 'a', 'b', 'd'] und sortieren dann in aufsteigender Reihenfolge nach Zeilenindex:
df.index = ['c', 'a', 'b', 'd']
df.sort_index(axis=0, ascending=True, inplace=True)
print(df)
Nach dem Login kopieren

Das Ausgabeergebnis lautet:

     姓名  年龄 性别   工资
a  Jerry  25  男  6000
b  Spike  18  女  4000
c    Tom  20  男  5000
d   Tyke  30  男  7000
Nach dem Login kopieren

Das Obige ist eine grundlegende Einführung und Beispiele für die Sortierung von Pandas. Mit den Methoden sort_values() und sort_index() können wir die Daten einfach sortieren, um sie ordentlich und ansehnlich zu machen. Ich hoffe, dieser Artikel kann Ihnen dabei helfen, Pandas besser für die Datenanalyse einzusetzen.

Das obige ist der detaillierte Inhalt vonEin genauerer Blick auf die Pandas-Sortierung: Erstellen Sie eine geordnete Ansicht Ihrer Daten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage