> 백엔드 개발 > 파이썬 튜토리얼 > 길이가 다른 Pandas DataFrame에서 중첩된 사전 열을 효율적으로 분할하려면 어떻게 해야 합니까?

길이가 다른 Pandas DataFrame에서 중첩된 사전 열을 효율적으로 분할하려면 어떻게 해야 합니까?

Mary-Kate Olsen
풀어 주다: 2024-12-28 06:27:15
원래의
854명이 탐색했습니다.

How Can I Efficiently Split Nested Dictionary Columns in Pandas DataFrames with Unequal Lengths?

json_normalize를 사용하여 Pandas에서 중첩 사전의 열 분할

Python에서 Pandas DataFrames로 작업할 때 다음과 같은 인스턴스가 발생할 수 있습니다. 마지막 열에는 중첩된 사전이 포함되어 있습니다. 이러한 값을 별도의 열로 추출하려면 사전의 길이가 같지 않으면 문제에 직면할 수 있습니다.

이 문서에서는 json_normalize() 함수를 사용하는 솔루션을 제시합니다. 예는 다음과 같습니다.

import pandas as pd

# Sample DataFrame with a column of nested dictionaries
df = pd.DataFrame({
    'Station ID': ['8809', '8810', '8811', '8812', '8813'],
    'Pollutant Levels': [
        {'a': '46', 'b': '3', 'c': '12'},
        {'a': '36', 'b': '5', 'c': '8'},
        {'b': '2', 'c': '7'},
        {'c': '11'},
        {'a': '82', 'c': '15'},
    ]
})

# Extract columns using json_normalize
df2 = pd.json_normalize(df['Pollutant Levels'])

# Concatenate with original DataFrame
df = pd.concat([df, df2], axis=1)

# Drop the original 'Pollutant Levels' column
df = df.drop(columns=['Pollutant Levels'])

print(df)
로그인 후 복사

출력:

   Station ID  a  b  c
0       8809  46  3  12
1       8810  36  5  8
2       8811  NaN  2  7
3       8812  NaN  NaN  11
4       8813  82  NaN  15
로그인 후 복사

이 접근 방식은 중첩된 사전 값을 별도의 열로 효과적으로 추출하여 다양한 사전 길이 문제를 처리합니다. json_normalize() 함수는 중첩된 JSON 데이터를 표 형식으로 효율적으로 변환하므로 복잡한 적용 함수가 필요하지 않습니다.

위 내용은 길이가 다른 Pandas DataFrame에서 중첩된 사전 열을 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿