다양한 항목 길이를 가진 사전에서 DataFrame 생성
항목이 다양한 길이의 배열을 보유하는 사전으로 작업할 때 각 열이 고유한 항목에 해당하는 DataFrame입니다. 이러한 사전을 DataFrame으로 직접 변환하려고 하면 "ValueError: arrays must all be the same length"가 발생합니다.
해결 방법
이 문제를 해결하려면 다음 중 하나를 수행하세요. 접근 방식에는 각 항목의 배열을 Series로 변환한 다음 결과 dict에서 DataFrame을 구성하는 작업이 포함됩니다. Python 3.x에서는 목록 이해를 사용하여 이를 달성할 수 있습니다.
d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.items() ])) # Output: A B 0 1 1 1 2 2 2 NaN 3 3 NaN 4
Python 2.x에서 코드는 유사하게 유지되지만 d.items() 호출이 d.iteritems( ):
pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.iteritems() ]))
이 기술은 효과적으로 각 사전 항목을 시리즈로 변환한 다음 해당 키를 열 이름으로 사용하여 DataFrame에 추가할 수 있습니다. 결과 DataFrame에는 원래 배열의 길이와 일치하는 길이의 열이 있습니다. 누락된 값은 일관된 열 구조를 보장하기 위해 NaN으로 표시됩니다.
이 접근 방식을 활용하면 다양한 배열 길이의 항목이 포함된 사전에서 DataFrame을 생성하여 추가 데이터 분석 및 조작이 가능합니다.
위 내용은 항목 길이가 다양한 사전에서 DataFrame을 만드는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!