Maison > développement back-end > Tutoriel Python > Quelles sont les méthodes opérationnelles de Python drop() pour supprimer des lignes et des colonnes ?

Quelles sont les méthodes opérationnelles de Python drop() pour supprimer des lignes et des colonnes ?

WBOY
Libérer: 2023-04-19 15:03:06
avant
3211 Les gens l'ont consulté

La fonction drop() peut s'avérer utile lors de l'ingénierie des fonctionnalités et de la division d'ensembles de données. Il peut facilement éliminer les données, les colonnes d'opérations, les lignes d'opérations, etc. La syntaxe détaillée de

drop() est la suivante :

La suppression des lignes est un index, la suppression des colonnes est des colonnes :

DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)
Copier après la connexion

Paramètres :

labels : Les étiquettes des lignes ou des colonnes à supprimer, qui peuvent être un seul étiquette ou une liste d'étiquettes.

axis : L'axe de la ligne ou de la colonne à supprimer, 0 signifie ligne, 1 signifie colonne.

index : L'index de la ligne à supprimer, qui peut être un index unique ou une liste d'index.

columns : Le nom de la colonne à supprimer, qui peut être un nom de colonne unique ou une liste de noms de colonnes.

inplace : indique s'il faut opérer sur le DataFrame d'origine. La valeur par défaut est False, ce qui signifie que l'opération ne sera pas effectuée sur le DataFrame d'origine.

Supprimer la colonne

Scénario d'utilisation 1 : supprimer les fonctionnalités inutiles.

Par exemple : si certaines fonctionnalités ont peu d'impact sur les résultats, vous pouvez supprimer les variables indépendantes qui ne sont pas liées à la variable dépendante ; afin d'éviter la multicolinéarité, vous devez supprimer les variables indépendantes qui ont une forte corrélation.

df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1)
df
Copier après la connexion

Explication du code :

data est un ensemble de données, les deux crochets représentent le format DataFrame, qui filtre 3 champs à supprimer

axis=1 représente la colonne d'opération ;

Scénario d'utilisation 2 : Supprimer la variable dépendante

# 自变量、因变量
x_data = df.drop(['Exited'],axis=1)
y_data = df['Exited']
x_data
Copier après la connexion

Explication du code : Remplissez le champ à supprimer dans la fonction Quelles sont les méthodes opérationnelles de Python drop() pour supprimer des lignes et des colonnes ?

drop(), ce qui signifie supprimer la colonne nommée "Exited" de

['Exited; '] celui-ci Le champ est la variable dépendante que nous voulons éliminer. Un seul champ peut être exprimé comme ceci

Résultats d'exécution :

Supprimer les lignes

Scénario d'utilisation 3 : Lors de la division de l'ensemble de données, une formation L'ensemble est généré et l'ensemble d'apprentissage est divisé. Les échantillons de l'ensemble sont éliminés et le reste constitue l'ensemble de test.

#划分训练集
train_data = data.sample(frac = 0.8, random_state = 0)
#测试集
test_data = data.drop(train_data.index)
Copier après la connexion

Explication du code : Quelles sont les méthodes opérationnelles de Python drop() pour supprimer des lignes et des colonnes ?

drop() remplit l'index des lignes pour supprimer des lignes ;

train_data est l'ensemble d'entraînement que nous avons divisé, train_data.index représente l'index des lignes ;

axis=0, représente la suppression des lignes, vous pouvez également le laisser de côté, c'est la valeur par défaut ;

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:yisu.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal