刪除 DF 中的重複項並在 python 中轉換為 JSON obj

王林
發布: 2024-02-22 13:20:03
轉載
690 人瀏覽過

删除 DF 中的重复项并在 python 中转换为 JSON obj

問題內容

我有一個類似於下面的 df

name         series
=============================
a             a1
b             b1
a             a2
a             a1
b             b2
登入後複製

我需要將系列轉換為一個列表,該列表應分配給每個名稱,例如字典或 json obj,如下所示

{
   "a": ["a1", "a2"],
   "b": ["b1", "b2"]
}
登入後複製

到目前為止,我已經嘗試使用 groupby,但它只是將所有內容分組為單獨的字典

test = df.groupby("series")[["name"]].apply(lambda x: x)
登入後複製

上面的程式碼給了一個類似 df 的輸出

Series
Name
A     0   A1
      2   A2
      3   A1
B     1   B1
      4   B2
登入後複製

非常感謝任何幫助

謝謝


正確答案


首先#drop_duplicates 確保有,然後groupby. agg 作為列表:

out = df.drop_duplicates().groupby('name')['series'].agg(list).to_dict()
登入後複製

或撥打unique

out = df.groupby('name')['series'].agg(lambda x: x.unique().tolist()).to_dict()
登入後複製

輸出:{'a': ['a1', 'a2'], 'b': ['b1', 'b2']}

如果您還有其他列,請確保僅保留感興趣的列:

out = (df[['name', 'series']].drop_duplicates()
       .groupby('name')['series'].agg(list).to_dict()
      )
登入後複製

對清單進行排序:

out = (df.groupby('name')['series']
         .agg(lambda x: sorted(x.unique().tolist())).to_dict()
      )
登入後複製

範例:

# input
  Name Series
0    A     Z1
1    B     B1
2    A     A2
3    A     Z1
4    B     B2

# output
{'A': ['A2', 'Z1'], 'B': ['B1', 'B2']}
登入後複製

以上是刪除 DF 中的重複項並在 python 中轉換為 JSON obj的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:stackoverflow.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!