Pandas를 사용하여 사전 열을 별도의 열로 분할
Pandas에서 데이터 프레임으로 작업할 때 사전이 포함된 열을 만나는 것이 일반적입니다. 가치. 이러한 열을 개별 열로 분할하면 데이터 구성 및 접근성이 향상될 수 있습니다.
다음 DataFrame을 고려하세요.
Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 {"a": "36", "b": "5", "c": "8"} 8811 {"b": "2", "c": "7"} 8812 {"c": "11"} 8813 {"a": "82", "c": "15"}
"오염 물질" 열을 별도의 "a", "b", 및 "c" 열에서는 Pandas 버전에 도입된 json_normalize 함수를 사용할 수 있습니다. 0.23.0:
import pandas as pd df2 = pd.json_normalize(df['Pollutants'])
이 접근 방식은 효율적이며 잠재적으로 비용이 많이 드는 적용 기능의 사용을 방지합니다. 결과 DataFrame df2는 다음과 같습니다.
Station ID a b c 8809 46 3 12 8810 36 5 8 8811 NaN 2 7 8812 NaN NaN 11 8813 82 NaN 15
결과 DataFrame에는 누락된 사전 키에 대한 null 값(NaN)이 포함되어 있습니다. 이러한 경우를 처리하려면 fillna 메소드를 사용하여 누락된 값을 기본값으로 바꾸거나 사용자 정의 논리를 적용할 수 있습니다.
위 내용은 사전의 Pandas DataFrame 열을 별도의 열로 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!