Pandas로 CSV 파일을 읽는 동안 발생하는 디코딩 오류
이 문제는 CSV 파일을 Pandas로 읽을 때 발생하며 그 결과 다음 오류가 발생합니다.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
근본 원인은 종종 인코딩 불일치로 인해 발생합니다. CSV 파일.
해결책
이 오류를 해결하기 위해 read_csv 함수는 인코딩 매개변수를 제공합니다. 적절한 인코딩을 지정하면 Pandas가 파일을 올바르게 해석하도록 지시할 수 있습니다. 일반적으로 사용되는 인코딩은 다음과 같습니다.
예를 들어 CSV 파일이 ISO-8859-1로 인코딩된 경우 다음 코드를 사용할 수 있습니다.
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
올바른 파일인지 확인 인코딩
올바른 인코딩이 확실하지 않은 경우 enca와 같은 도구를 사용할 수 있습니다. 또는 파일을 분석할 파일:
추가 리소스
위 내용은 CSV 파일을 읽을 때 Pandas의 UnicodeDecodeError를 어떻게 수정할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!