如何將 Pandas 字典列拆分為單獨的欄位
在 Pandas DataFrame 中,可能會遇到包含字典的欄位。要將這些字典中的值提取到單獨的列中,json_normalize 函數是一個有效的解決方案。
以下程式碼示範了這個過程:
這將建立一個新的 DataFrame df2,其中包含「污染物等級」字典列中的值分為單獨的欄位。
處理不同的長度列表:
所提供的要求指定字典中的所有列表包含相同的三個鍵('a'、'b'、' c'),但長度不一定相同。為了適應這種情況,程式碼使用 json_normalize,它透過用 NaN 填充缺失值來自動處理變數列表長度。
Unicode 問題解決方案:
如果字典值是採用Unicode 格式(u{'a': '1', 'b': '2', ' c': '3'} 而非{u'a': '1', u'b': '2', u'c': '3'}),程式碼仍然可以正確運作。 json_normalize 可以處理兩種類型的 Unicode 字串。
Unicode 範例:
對於以Unicode 格式從PostgreSQL 資料庫匯入的資料:
這會將字串轉換為常規字串字串,然後將字典列拆分為單獨的列。
以上是如何有效地將 Pandas 字典列拆分為單獨的列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!