Python에서 유니코드 텍스트 파일 읽기 및 쓰기
텍스트 파일의 유니코드 문자를 처리할 때 Python은 적절한 처리를 보장하기 위해 여러 가지 접근 방식을 제공합니다. encode() 및 decode() 메서드를 사용하여 유니코드 문자열을 읽고 쓰려고 할 때 한 가지 일반적인 문제가 발생합니다.
이 문제를 극복하려면 파일을 열 때 파일 인코딩을 지정하는 것이 좋습니다. Python 2.6에 io 모듈이 도입되면서 io.open 함수를 사용할 수 있게 되었고 원하는 인코딩을 지정할 수 있게 되었습니다.
<code class="python">import io # Assuming the file is encoded in UTF-8 f = io.open("test", mode="r", encoding="utf-8") unicodeString = f.read()</code>
Python 3.x에서 io.open 함수는 별칭입니다. 내장된 열기 기능의 경우 가져오기가 필요하지 않습니다.
또 다른 옵션은 코덱 표준 라이브러리의 open()을 사용하는 것입니다. 모듈:
<code class="python">import codecs f = codecs.open("test", "r", "utf-8") unicodeString = f.read()</code>
그러나 이 접근 방식은 read() 및 readline() 작업을 혼합할 때 호환성 문제가 발생할 수 있습니다.
유니코드 문자열을 UTF-8 인코딩으로 파일에 쓰려면, 다음 코드 조각을 사용할 수 있습니다.
<code class="python"># assumes unicodeString is a Unicode string outputFile = io.open("output.txt", mode="w", encoding="utf-8") outputFile.write(unicodeString)</code>
이러한 지침을 따르면 읽기 및 읽기 작업 시 유니코드 문자가 올바르게 처리되도록 할 수 있습니다. Python으로 텍스트 파일 작성
위 내용은 Python에서 유니코드 텍스트 파일을 읽고 쓰는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!