4, Datenbereinigung (Spalte umbenennen)Während Python mit Excel arbeitet, ging es im vorherigen Artikel um das Lesen, Einfügen und einfache Analysieren von Daten. Ein weiterer sehr wichtiger Punkt ist die Datenbereinigung. Was ist also Datenbereinigung? Um es ganz klar auszudrücken: Es bedeutet, Junk-Werte im Datentext zu entfernen, wie zum Beispiel: vorhandene Nullwerte, redundante Leerzeichen, Datenformate usw. Verwandte kostenlose Lernempfehlungen: Python-Video-Tutorial im Feld)
# 导入 pandas 库import pandas as pd# read_excel() 读取 excel 数据# DataFrame() 将读取到的数据转换为 DataFrame 数据df = pd.DataFrame(pd.read_excel('data.xlsx'))Nach dem Login kopieren
# dropna() 函数去除 df 数据表中存在空值的所有行df.dropna(how='any')# mean() 函数计算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函数对存在的空值进行填充,将 age_pre 的值填充到字段为空的值内面df['age'].fillna(age_pre)
# 清除字段的空格df['name'] = df['name'].map(str.strip)
# rename() 函数对列进行重命名df.rename(columns={'name': 'name_new'})
Das obige ist der detaillierte Inhalt vonPython-Operation Excel-Serie: Datenbereinigung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!