df.to_dict()를 사용하여 데이터 샘플을 쉽게 공유
좋은 질문에 대한 명확한 지침과 재현 가능한 데이터 샘플을 포함했음에도 불구하고 많은 사용자들은 분석을 위한 충분한 데이터 제공을 소홀히 하는 경우가 많습니다. 이 기사에서는 난수보다 더 복잡한 샘플 데이터 프레임을 공유하는 실용적인 방법으로 df.to_dict() 함수를 사용하는 방법을 살펴봅니다.
사례 1: 로컬 소스의 데이터 프레임
로컬 소스에서 얻은 데이터프레임의 경우 이 접근 방식은 다음과 같습니다. 간단함:
사례 2: 다른 애플리케이션의 테이블
테이블이 Excel과 같은 애플리케이션에 있는 경우 다음 단계를 사용할 수 있습니다.
더 큰 크기로 처리 데이터 프레임
더 큰 데이터 프레임의 경우 다음 접근 방식을 고려하세요.
Iris 데이터세트 사용 예시
plotly express에서 사용 가능한 것으로 알려진 iris 데이터세트를 생각해 보세요.
import plotly.express as px import pandas as pd df = px.data.iris().head(10) sample = df.to_dict('split')
이것은 인덱스, 열 및 데이터 키가 포함된 사전을 생성하여 데이터프레임을 쉽게 다시 생성할 수 있습니다. 사용:
df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
편집
df.to_dict()는 필요한 가져오기(예: from pandas import Timestamp)를 명시적으로 포함하지 않으면 타임스탬프를 읽을 수 없습니다.
위 내용은 재현 가능한 코드 예제를 위해 복잡한 DataFrame을 어떻게 쉽게 공유할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!