Python-Operation Excel-Serie: Datenbereinigung

coldplay.xixi
Freigeben: 2021-03-02 10:20:00
nach vorne
3927 Leute haben es durchsucht

Python-Operation Excel-Serie: Datenbereinigung

Während Python mit Excel arbeitet, ging es im vorherigen Artikel um das Lesen, Einfügen und einfache Analysieren von Daten. Ein weiterer sehr wichtiger Punkt ist die Datenbereinigung. Was ist also Datenbereinigung? Um es ganz klar auszudrücken: Es bedeutet, Junk-Werte im Datentext zu entfernen, wie zum Beispiel: vorhandene Nullwerte, redundante Leerzeichen, Datenformate usw. Verwandte kostenlose Lernempfehlungen: Python-Video-Tutorial im Feld)

# 导入 pandas 库import pandas as pd# read_excel() 读取 excel 数据# DataFrame() 将读取到的数据转换为 DataFrame 数据df = pd.DataFrame(pd.read_excel('data.xlsx'))
Nach dem Login kopieren
4, Datenbereinigung (Spalte umbenennen)

# dropna() 函数去除 df 数据表中存在空值的所有行df.dropna(how='any')# mean() 函数计算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函数对存在的空值进行填充,将 age_pre 的值填充到字段为空的值内面df['age'].fillna(age_pre)
Nach dem Login kopieren
5, Datenbereinigung (doppelte Werte in einer Spalte entfernen)
# 清除字段的空格df['name'] = df['name'].map(str.strip)
Nach dem Login kopieren
6, Datenbereinigung (Datenwertersetzung)
# rename() 函数对列进行重命名df.rename(columns={'name': 'name_new'})
Nach dem Login kopieren
Verwandt kostenlose Lernempfehlungen:
Python-Tutorial
(Video)

Das obige ist der detaillierte Inhalt vonPython-Operation Excel-Serie: Datenbereinigung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:csdn.net
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage