> 백엔드 개발 > 파이썬 튜토리얼 > CSV 파일을 읽을 때 Pandas의 UnicodeDecodeError를 어떻게 수정할 수 있나요?

CSV 파일을 읽을 때 Pandas의 UnicodeDecodeError를 어떻게 수정할 수 있나요?

Patricia Arquette
풀어 주다: 2025-01-03 21:45:40
원래의
592명이 탐색했습니다.

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

Pandas로 CSV 파일을 읽는 동안 발생하는 디코딩 오류

이 문제는 CSV 파일을 Pandas로 읽을 때 발생하며 그 결과 다음 오류가 발생합니다.

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
로그인 후 복사

근본 원인은 종종 인코딩 불일치로 인해 발생합니다. CSV 파일.

해결책

이 오류를 해결하기 위해 read_csv 함수는 인코딩 매개변수를 제공합니다. 적절한 인코딩을 지정하면 Pandas가 파일을 올바르게 해석하도록 지시할 수 있습니다. 일반적으로 사용되는 인코딩은 다음과 같습니다.

  • UTF-8: 인코딩 = "utf-8"
  • ISO-8859-1: 인코딩 = "ISO-8859-1"
  • Latin-1: 인코딩 = "latin"
  • Windows-1252: 인코딩 = "cp1252"

예를 들어 CSV 파일이 ISO-8859-1로 인코딩된 경우 다음 코드를 사용할 수 있습니다.

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
로그인 후 복사

올바른 파일인지 확인 인코딩

올바른 인코딩이 확실하지 않은 경우 enca와 같은 도구를 사용할 수 있습니다. 또는 파일을 분석할 파일:

  • enca: 파일 인코딩에 대한 자세한 보고서를 제공합니다.
  • 파일: 표시합니다. 인코딩을 포함한 파일에 대한 간략한 설명

추가 리소스

  • [Pandas CSV 문서](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html)
  • [Python CSV 파일 예](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [유니코드 문자 및 인코딩](https://realpython.com/python-encodings-guide/)

위 내용은 CSV 파일을 읽을 때 Pandas의 UnicodeDecodeError를 어떻게 수정할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿