Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?

WBOY
Freigeben: 2023-04-19 15:03:06
nach vorne
3184 Leute haben es durchsucht

Die Funktion drop() kann beim Feature-Engineering und beim Teilen von Datensätzen nützlich sein. Daten, Operationsspalten, Operationszeilen usw. können problemlos entfernt werden. Die detaillierte Syntax von

drop() lautet wie folgt:

Zeilen löschen ist Index, Spalten löschen ist Spalten:

DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)
Nach dem Login kopieren

Parameter:

Beschriftungen: Die Beschriftungen der zu löschenden Zeilen oder Spalten, die einzeln sein können label oder eine Liste von Labels.

Achse: Die Achse der zu löschenden Zeile oder Spalte, 0 bedeutet Zeile, 1 bedeutet Spalte.

index: Der Index der zu löschenden Zeile, der ein einzelner Index oder eine Liste von Indizes sein kann.

Spalten: Der Spaltenname der zu löschenden Spalte. Dabei kann es sich um einen einzelnen Spaltennamen oder eine Liste von Spaltennamen handeln.

inplace: Ob der ursprüngliche DataFrame bearbeitet werden soll. Der Standardwert ist False, was bedeutet, dass der Vorgang nicht am ursprünglichen DataFrame ausgeführt wird.

Spalte löschen

Verwendungsszenario 1: Nicht benötigte Funktionen löschen.

Zum Beispiel: Wenn einige Funktionen nur geringe Auswirkungen auf die Ergebnisse haben, können Sie die unabhängigen Variablen löschen, die nicht mit der abhängigen Variablen zusammenhängen. Um Multikollinearität zu vermeiden, sollten Sie die unabhängigen Variablen löschen, die eine starke Korrelation aufweisen.

df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1)
df
Nach dem Login kopieren

Code-Erklärung:

Daten sind ein Datensatz, die beiden eckigen Klammern stellen das DataFrame-Format dar, das 3 zu löschende Felder herausfiltert;

Achse = 1 stellt die Operationsspalte dar;

Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten? Verwendungsszenario 2: Löschen Sie die abhängige Variable

# 自变量、因变量
x_data = df.drop(['Exited'],axis=1)
y_data = df['Exited']
x_data
Nach dem Login kopieren

Code-Erklärung: Füllen Sie das zu löschende Feld in der Funktion

drop() aus, was bedeutet, dass die Spalte mit dem Namen „Exited“ aus df gelöscht wird; '] Dieses Feld ist die abhängige Variable, die wir eliminieren möchten.

Ergebnisse ausführen:

Zeilen löschen

Was sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?Verwendungsszenario 3: Beim Teilen des Datensatzes ein Training Der Satz wird generiert und der Trainingssatz wird geteilt. Die Proben im Satz werden eliminiert und der Rest ist der Testsatz.

#划分训练集
train_data = data.sample(frac = 0.8, random_state = 0)
#测试集
test_data = data.drop(train_data.index)
Nach dem Login kopieren

Code-Erklärung:

drop()-Funktion füllt den Zeilenindex aus, um Zeilen zu löschen;

train_data ist der Trainingssatz, den wir geteilt haben, train_data.index stellt den Zeilenindex dar,

axis=0, stellt das Löschen von Zeilen dar, Sie können es auch weglassen, es ist der Standardwert

Das obige ist der detaillierte Inhalt vonWas sind die Operationsmethoden von Python drop() zum Löschen von Zeilen und Spalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:yisu.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage