DataFrames: Votre guide essentiel pour l'exportation vers CSV dans Python
Les données de données sont la pierre angulaire de la manipulation et de l'analyse des données dans Python, en particulier dans la bibliothèque Pandas. Leur polyvalence s'étend à l'exportation de données sans effort, en particulier vers le format CSV largement utilisé (valeurs séparés par des virgules). Ce guide détaille comment exporter de manière transparente Pandas DataFrames vers les fichiers CSV dans Jupyter Notebook, en surlitant les paramètres clés et les meilleures pratiques.
Table des matières
to_csv()
sep
na_rep
columns
header
index
index_label
mode
encoding
date_format
compression
chunksize
Exportation d'une dataframe vers CSV
Étape 1: Création de votre dataframe
Pandas propose plusieurs façons de créer des dataframes:
Méthode 1: Création manuelle des données
Importer des pandas en tant que PD data = { "Nom": ["Alice", "Bob", "Charlie"], "Âge": [25, 30, 35], "City": ["New York", "Los Angeles", "Chicago"] } df_manual = pd.dataframe (données) print (df_manual)
Méthode 2: Importation d'une source externe
# Importation à partir d'un fichier CSV df_csv = pd.read_csv ("sample.csv") print ("\ ndataframe de CSV:") print (df_csv)
Méthode 3: Utiliser des ensembles de données Scikit-Learn
de sklearn.datasets importent load_iris Importer des pandas en tant que PD iris = load_iris () df_sklearn = pd.dataframe (data = iris.data, colonnes = iris.feture_names) df_sklearn ['cible'] = iris.target print ("\ ndataframe from iris dataSet:") print (df_sklearn.head ())
Étape 2: Exportation vers un fichier CSV
La méthode to_csv()
fournit un contrôle granulaire sur le processus d'exportation:
1. Économiser au répertoire actuel
Importer un système d'exploitation print (os.getcwd ()) #shows répertoire de travail actuel data = {"name": ["Alice", "Bob"], "Age": [25, 30]} df = pd.dataframe (données) df.to_csv ("output.csv", index = false)
2. Économiser sur un sous-répertoire
Importer un système d'exploitation Si non OS.Path.Exists ("Data"): OS.MakedIrs ("Data") df.to_csv ("data / output.csv", index = false)
3. Économiser sur un chemin absolu
df.to_csv (r "c: \ users \ yasha \ videos \ demo2 \ output.csv", index = false) #User la chaîne brute (r "") pour les chemins Windows
paramètres de fonction to_csv()
Explorons les paramètres clés de la fonction to_csv()
:
sep
(par défaut ','): Spécifie le séparateur de champ (par exemple, ';', '\ t').na_rep
(par défaut ""): remplace les valeurs manquantes (nan).columns
: sélectionne des colonnes spécifiques pour l'exportation.header
(par défaut True): inclut les en-têtes de colonne. Peut être défini sur False
ou une liste personnalisée.index
(par défaut True): inclut l'index DataFrame.index_label
: fournit une étiquette personnalisée pour la colonne d'index.mode
(par défaut «W»): «W» pour écrire (écrase), «A» pour ajouter.encoding
(Système par défaut par défaut): Spécifie le codage (par exemple, «UTF-8»).date_format
: Formats des objets DateTime.compression
: permet la compression des fichiers (par exemple, «gzip», «zip»).chunksize
: Exportations en morceaux pour de grands ensembles de données.Des exemples illustrant plusieurs paramètres sont indiqués dans le texte d'origine.
Conclusion
La méthode to_csv()
propose une solution complète et flexible pour exporter des Frames de données Pandas aux fichiers CSV. Ses divers paramètres permettent un contrôle précis de la sortie, garantissant la compatibilité et la gestion efficace des données.
Questions fréquemment posées
Les FAQ du texte d'origine sont conservées ici.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!