Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menghapuskan Lajur Senarai dalam Pandas DataFrames?

Bagaimana untuk Menghapuskan Lajur Senarai dalam Pandas DataFrames?

Patricia Arquette
Lepaskan: 2024-12-30 19:21:10
asal
294 orang telah melayarinya

How to Unnest List Columns in Pandas DataFrames?

Menyahsarang Lajur dengan Panda

Apabila berurusan dengan DataFrames yang mengandungi lajur senarai, adalah berguna untuk "membuka" senarai ini ke dalam baris yang berasingan.

Kaedah 1: Menggunakan DataFrame.explode() (Panda >= 0.25)

Untuk letupan satu lajur, gunakan explode() terus:

df = pd.DataFrame({'A': [1, 2], 'B': [[1, 2], [1, 2]]})

df_exploded = df.explode('B')
Salin selepas log masuk

Kaedah 2: Guna Siri

df_exploded = df.set_index('A').B.apply(pd.Series).stack().reset_index(level=0).rename(columns={0:'B'})
Salin selepas log masuk

Kaedah 3: UlangiFrame Data

df_exploded = pd.DataFrame({'A':df.A.repeat(df.B.str.len()),'B':np.concatenate(df.B.values)})
Salin selepas log masuk

Kaedah 4: Reindex/Loc

df_exploded = df.reindex(df.index.repeat(df.B.str.len())).assign(B=np.concatenate(df.B.values))
Salin selepas log masuk

Kaedah 5: ChainMap

from collections import ChainMap
d = dict(ChainMap(*map(dict.fromkeys, df['B'], df['A'])))
df_exploded = pd.DataFrame(list(d.items()),columns=df.columns[::-1])
Salin selepas log masuk

Kaedah 6: Numpy

newvalues=np.dstack((np.repeat(df.A.values,list(map(len,df.B.values))),np.concatenate(df.B.values)))
df_exploded = pd.DataFrame(data=newvalues[0],columns=df.columns)
Salin selepas log masuk

Kaedah 7: Iterator

from itertools import cycle,chain
l=df.values.tolist()
l1=[list(zip([x[0]], cycle(x[1])) if len([x[0]]) > len(x[1]) else list(zip(cycle([x[0]]), x[1]))) for x in l]
df_exploded = pd.DataFrame(list(chain.from_iterable(l1)),columns=df.columns)
Salin selepas log masuk

Generalisasi kepada Berbilang Lajur

Kepada umumkan kaedah di atas untuk berbilang lajur, gunakan fungsi berikut:

def unnesting(df, explode):
    idx = df.index.repeat(df[explode[0]].str.len())
    df1 = pd.concat([
        pd.DataFrame({x: np.concatenate(df[x].values)}) for x in explode], axis=1)
    df1.index = idx
    
    return df1.join(df.drop(explode, 1), how='left')
Salin selepas log masuk

Column-Wise Unnesting

Untuk membuka sarang secara mendatar, ubah suai fungsi:

def unnesting(df, explode, axis):
    if axis==1:
        # Previous implementation
    else :
        df1 = pd.concat([
                         pd.DataFrame(df[x].tolist(), index=df.index).add_prefix(x) for x in explode], axis=1)
        return df1.join(df.drop(explode, 1), how='left')
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk Menghapuskan Lajur Senarai dalam Pandas DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan