如何標準化 DataFrame 欄位以實現資料一致性?

Susan Sarandon
發布: 2024-10-18 16:57:29
原創
586 人瀏覽過

How Can You Normalize DataFrame Columns to Achieve Data Consistency?

標準化 DataFrame 欄位以保持一致性

在資料分析中,通常需要標準化 DataFrame 的資料列以確保資料範圍的一致性。當處理來自不同來源的資料或值具有不同比例時,這一點尤其重要。

問題陳述

考慮一個包含不同值範圍的列的資料框:

df:
    A     B   C
1000  10  0.5
765   5   0.35
800   7   0.09
登入後複製

目標是標準化此資料幀的資料列,使每個值落在0 和1 之間。

平均值歸一化

使用Pandas,平均值歸一化可以實現如下:

normalized_df = (df - df.mean()) / df.std()
登入後複製

此方法從原始值中減去每列的平均值,然後除以標準差。

最小-最大歸一化

對於最小-最大歸一化:

normalized_df = (df - df.min()) / (df.max() - df.min())
登入後複製

此方法計算每個值的最小值和最大值列並使用它們將原始值縮放到範圍[0, 1]。

結果

兩種標準化方法都會產生一個資料幀,其中每個值是0 到 1 之間。對於給定的範例資料幀,預期輸出為:

A     B    C
1     1    1
0.765 0.5  0.7
0.8   0.7  0.18
登入後複製

以上是如何標準化 DataFrame 欄位以實現資料一致性?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板