pd.read_csv('somefile.csv')를 사용하여 Pandas로 CSV 파일을 로드할 때 다음과 같은 문제가 발생할 수 있습니다. 경고:
DtypeWarning: Columns (4,5,7,16) have mixed types. Specify dtype option on import or set low_memory=False.
low_memory 옵션은 더 이상 사용되지 않으며 기능에 영향을 주지 않습니다. 그 목적은 유형 추론을 방지하여 파일 구문 분석 중 메모리 사용량을 줄이는 것이었습니다. 하지만 이제는 별반 차이가 없습니다.
각 열에 대한 dtype을 추측하는 데 리소스가 많이 소모되기 때문에 경고가 발생합니다. Pandas는 전체 파일을 분석하여 dtype을 결정합니다. dtype을 명시적으로 정의하지 않으면 전체 파일을 읽을 때까지 구문 분석을 시작할 수 없습니다.
dtype을 지정하면(예: dtype={'user_id': int}) Pandas에 알립니다. 예상되는 데이터 유형에 대해 즉시 구문 분석을 시작할 수 있습니다.
pd.read_csv('somefile.csv', dtype={'user_id': int})
dtype을 정의하면 잘못된 데이터 유형(예: 정수 열의 "foobar")이 발생할 때 오류를 방지할 수 있습니다.
Pandas는 다음을 포함한 다양한 dtype을 지원합니다.
Pandas 관련:
변환기를 사용하여 잠재적으로 유효하지 않은 데이터(예: 정수 열의 "foobar")를 처리합니다. 하지만 변환기는 속도가 느리고 비효율적이므로 주의해서 사용하세요.
위 내용은 Pandas의 Dtype 경고를 처리하는 방법: Low_Memory 및 Dtype 옵션?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!