Maison développement back-end Tutoriel Python Utilisez pandas pour traiter facilement les données des fichiers txt

Utilisez pandas pour traiter facilement les données des fichiers txt

Jan 19, 2024 am 08:50 AM
txt pandas 处理

Utilisez pandas pour traiter facilement les données des fichiers txt

Utilisez des pandas pour traiter facilement les données des fichiers txt

Dans l'analyse et le traitement des données, nous rencontrons souvent des situations où les données lues à partir des fichiers txt doivent être traitées. Par exemple, le format des données prête à confusion et doit être nettoyé ; certaines colonnes ne sont pas valides et doivent être supprimées ; certaines colonnes doivent être converties en type, etc. Ces tâches peuvent demander beaucoup de travail et de temps, mais nous pouvons facilement réaliser ces opérations grâce à la bibliothèque Python pandas.

Cet article combinera des exemples de code pour vous apprendre à utiliser les pandas pour traiter les données des fichiers txt.

  1. Présentez la bibliothèque pandas

Avant d'utiliser la bibliothèque pandas, nous devons d'abord la présenter. Dans les scripts Python, il est généralement convenu de renommer la bibliothèque pandas en pd pour faciliter les appels ultérieurs.

import pandas as pd
Copier après la connexion
  1. Lire le fichier txt

Tout d'abord, nous devons lire les données dans le fichier txt. Chez les pandas, nous utilisons la fonction pd.read_csv() pour lire les données. Bien que le nom de la fonction contienne csv, cette fonction convient également à la lecture de fichiers txt.

data = pd.read_csv('data.txt', sep='    ', header=None)
Copier après la connexion

Les paramètres de la fonction sont expliqués comme suit :

  • 'data.txt' : indique le chemin et le nom du fichier txt que nous devons lire.
  • sep : Indique le séparateur de données. ' ' est utilisé ici pour indiquer que les données sont séparées par des tabulations, et il peut également être remplacé par d'autres symboles.
  • header : indique si le fichier contient des noms de colonnes, sinon, il est défini sur Aucun.

Après avoir lu les données, nous pouvons visualiser le contenu et la forme des données en imprimant les données.

print(data)
Copier après la connexion

Résultat de sortie :

   0    1    2
0  A  123  1.0
1  B  321  2.0
2  C  231  NaN
3  D  213  4.0
4  E  132  3.0
Copier après la connexion

On peut voir que les données lues ont été stockées dans des données sous forme de DataFrame.

  1. Nettoyage des données

Les données lues peuvent présenter de nombreuses irrégularités ou erreurs de format, ce qui nous oblige à nettoyer les données. Par exemple, il peut y avoir des valeurs manquantes dans certaines lignes ou colonnes, et nous devons les remplir ou les supprimer ; le type de données de certaines colonnes peut ne pas répondre à nos besoins, et nous devons les convertir en types numériques ou chaînes, etc. .

a. Supprimer les lignes avec des valeurs manquantes

Nous pouvons utiliser la fonction dropna() pour supprimer les lignes avec des valeurs manquantes.

data_clean = data.dropna()
Copier après la connexion

Cette fonction supprimera toutes les lignes contenant des valeurs manquantes dans les données et renverra un DataFrame avec uniquement des données complètes.

b. Remplissez les valeurs manquantes

Si les lignes contenant des valeurs manquantes ne peuvent pas être supprimées, nous pouvons choisir de remplir ces valeurs manquantes. Utilisez simplement la fonction fillna().

data_fill = data.fillna(0)
Copier après la connexion

Cette fonction remplit les valeurs manquantes avec 0. Si vous souhaitez la remplir avec d'autres valeurs, vous pouvez passer la valeur correspondante entre parenthèses.

c. Convertir les types de données

Dans l'analyse des données, certains types de données doivent être convertis en types numériques ou caractères pour un calcul ou un traitement ultérieur. Dans les pandas, vous pouvez utiliser la fonction astype() pour la conversion de type.

data_conversion = data_clean.astype({'1': 'int', '2': 'str'})
Copier après la connexion

Cette fonction peut convertir le type de colonne 1 dans data_clean en type entier (int) et le type de colonne 2 en type chaîne (str).

  1. Enregistrer les nouvelles données

Enfin, nous devons enregistrer les données nettoyées et traitées dans un nouveau fichier txt. Chez les pandas, nous pouvons utiliser la fonction to_csv() pour y parvenir.

data_clean.to_csv('data_clean.txt', index=False, header=False, sep='    ')
Copier après la connexion

Les paramètres de la fonction sont expliqués comme suit :

  • 'data_clean.txt' : Indique le chemin et le nom du fichier enregistré.
  • index : indique s'il faut conserver l'index de ligne. Sélectionnez ici False pour ne pas le conserver.
  • header : indique si le nom de la colonne est inclus dans le fichier. Sélectionnez False ici pour l'exclure.
  • sep : Indique le séparateur ' ' est utilisé ici pour indiquer l'utilisation de la tabulation comme séparateur.

Exemple de code

Vous trouverez ci-dessous l'exemple de code complet que vous pouvez copier dans un script Python et exécuter.

import pandas as pd

# 读入数据
data = pd.read_csv('data.txt', sep='    ', header=None)
print('原始数据:
', data)

# 删除含有缺失值的行
data_clean = data.dropna()
print('处理后数据(删除缺失值):
', data_clean)

# 填充缺失值
data_fill = data.fillna(0)
print('处理后数据(填充缺失值):
', data_fill)

# 转换数据类型
data_conversion = data_clean.astype({'1': 'int', '2': 'str'})
print('处理后数据(类型转换):
', data_conversion)

# 保存新数据
data_clean.to_csv('data_clean.txt', index=False, header=False, sep='    ')
Copier après la connexion

Cet article explique comment utiliser pandas pour traiter facilement les données des fichiers txt, y compris la lecture, le nettoyage, la conversion et la sauvegarde des données. En tant que l'un des outils de traitement de données importants de Python, les pandas peuvent nous aider à accomplir plus efficacement les tâches d'exploration et d'analyse de données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le processus de fonctionnement de l'hôte de service WIN10 occupant trop de CPU Le processus de fonctionnement de l'hôte de service WIN10 occupant trop de CPU Mar 27, 2024 pm 02:41 PM

1. Tout d'abord, nous cliquons avec le bouton droit sur l'espace vide de la barre des tâches et sélectionnons l'option [Gestionnaire des tâches], ou cliquons avec le bouton droit sur le logo de démarrage, puis sélectionnons l'option [Gestionnaire des tâches]. 2. Dans l'interface du Gestionnaire des tâches ouverte, nous cliquons sur l'onglet [Services] à l'extrême droite. 3. Dans l'onglet [Service] ouvert, cliquez sur l'option [Ouvrir le service] ci-dessous. 4. Dans la fenêtre [Services] qui s'ouvre, cliquez avec le bouton droit sur le service [InternetConnectionSharing(ICS)], puis sélectionnez l'option [Propriétés]. 5. Dans la fenêtre des propriétés qui s'ouvre, remplacez [Ouvrir avec] par [Désactivé], cliquez sur [Appliquer] puis cliquez sur [OK]. 6. Cliquez sur le logo Démarrer, puis cliquez sur le bouton d'arrêt, sélectionnez [Redémarrer] et terminez le redémarrage de l'ordinateur.

Résoudre les problèmes courants d'installation de pandas : interprétation et solutions aux erreurs d'installation Résoudre les problèmes courants d'installation de pandas : interprétation et solutions aux erreurs d'installation Feb 19, 2024 am 09:19 AM

Tutoriel d'installation de Pandas : analyse des erreurs d'installation courantes et de leurs solutions, des exemples de code spécifiques sont requis Introduction : Pandas est un puissant outil d'analyse de données largement utilisé dans le nettoyage des données, le traitement des données et la visualisation des données, il est donc très respecté dans le domaine de la science des données. Cependant, en raison de problèmes de configuration de l'environnement et de dépendances, vous pouvez rencontrer des difficultés et des erreurs lors de l'installation de pandas. Cet article vous fournira un didacticiel d'installation de pandas et analysera certaines erreurs d'installation courantes et leurs solutions. 1. Installez les pandas

Comment lire correctement le fichier txt à l'aide de pandas Comment lire correctement le fichier txt à l'aide de pandas Jan 19, 2024 am 08:39 AM

Comment utiliser pandas pour lire correctement les fichiers txt nécessite des exemples de code spécifiques. Pandas est une bibliothèque d'analyse de données Python largement utilisée. Elle peut être utilisée pour traiter une variété de types de données, notamment des fichiers CSV, des fichiers Excel, des bases de données SQL, etc. En même temps, il peut également être utilisé pour lire des fichiers texte, tels que des fichiers txt. Cependant, lors de la lecture de fichiers txt, nous rencontrons parfois quelques problèmes, comme des problèmes d'encodage, des problèmes de délimiteur, etc. Cet article explique comment lire correctement le txt à l'aide de pandas.

Conseils pratiques pour lire les fichiers txt à l'aide de pandas Conseils pratiques pour lire les fichiers txt à l'aide de pandas Jan 19, 2024 am 09:49 AM

Conseils pratiques pour lire les fichiers txt à l'aide de pandas, des exemples de code spécifiques sont requis Dans l'analyse et le traitement des données, les fichiers txt sont un format de données courant. L'utilisation de pandas pour lire les fichiers txt permet un traitement des données rapide et pratique. Cet article présentera plusieurs techniques pratiques pour vous aider à mieux utiliser les pandas pour lire les fichiers txt, ainsi que des exemples de code spécifiques. Lire des fichiers txt avec des délimiteurs Lorsque vous utilisez pandas pour lire des fichiers txt avec des délimiteurs, vous pouvez utiliser read_c

Révéler la méthode efficace de déduplication des données dans Pandas : conseils pour supprimer rapidement les données en double Révéler la méthode efficace de déduplication des données dans Pandas : conseils pour supprimer rapidement les données en double Jan 24, 2024 am 08:12 AM

Le secret de la méthode de déduplication Pandas : un moyen rapide et efficace de dédupliquer les données, qui nécessite des exemples de code spécifiques. Dans le processus d'analyse et de traitement des données, une duplication des données est souvent rencontrée. Les données en double peuvent induire en erreur les résultats de l'analyse, la déduplication est donc une étape très importante. Pandas, une puissante bibliothèque de traitement de données, fournit une variété de méthodes pour réaliser la déduplication des données. Cet article présentera certaines méthodes de déduplication couramment utilisées et joindra des exemples de code spécifiques. Le cas le plus courant de déduplication basée sur une seule colonne dépend de la duplication ou non de la valeur d'une certaine colonne.

Apprenez à gérer les caractères spéciaux et à convertir les guillemets simples en PHP Apprenez à gérer les caractères spéciaux et à convertir les guillemets simples en PHP Mar 27, 2024 pm 12:39 PM

Dans le processus de développement PHP, la gestion des caractères spéciaux est un problème courant, en particulier dans le traitement des chaînes, les caractères spéciaux sont souvent échappés. Parmi eux, la conversion de caractères spéciaux en guillemets simples est une exigence relativement courante, car en PHP, les guillemets simples sont un moyen courant d'encapsuler des chaînes. Dans cet article, nous expliquerons comment gérer les guillemets simples de conversion de caractères spéciaux en PHP et fournirons des exemples de code spécifiques. En PHP, les caractères spéciaux incluent, sans s'y limiter, les guillemets simples ('), les guillemets doubles ("), la barre oblique inverse (), etc. Dans les chaînes

Tutoriel d'utilisation de Pandas : Démarrage rapide pour la lecture de fichiers JSON Tutoriel d'utilisation de Pandas : Démarrage rapide pour la lecture de fichiers JSON Jan 13, 2024 am 10:15 AM

Démarrage rapide : méthode Pandas de lecture des fichiers JSON, des exemples de code spécifiques sont requis Introduction : Dans le domaine de l'analyse des données et de la science des données, Pandas est l'une des bibliothèques Python importantes. Il fournit des fonctions riches et des structures de données flexibles, et peut facilement traiter et analyser diverses données. Dans les applications pratiques, nous rencontrons souvent des situations où nous devons lire des fichiers JSON. Cet article expliquera comment utiliser Pandas pour lire des fichiers JSON et joindra des exemples de code spécifiques. 1. Installation de Pandas

Tutoriel d'installation simple de pandas : conseils détaillés sur la façon d'installer des pandas sur différents systèmes d'exploitation Tutoriel d'installation simple de pandas : conseils détaillés sur la façon d'installer des pandas sur différents systèmes d'exploitation Feb 21, 2024 pm 06:00 PM

Tutoriel d'installation simple de Pandas : des conseils détaillés sur la façon d'installer Pandas sur différents systèmes d'exploitation, des exemples de code spécifiques sont nécessaires. Alors que la demande de traitement et d'analyse de données continue d'augmenter, Pandas est devenu l'un des outils préférés de nombreux scientifiques et analystes de données. pandas est une puissante bibliothèque de traitement et d'analyse de données qui peut facilement traiter et analyser de grandes quantités de données structurées. Cet article détaillera comment installer des pandas sur différents systèmes d'exploitation et fournira des exemples de code spécifiques. Installer sur le système d'exploitation Windows

See all articles