파일 쓰기를 위한 유니코드 텍스트 디코딩
유니코드 텍스트를 파일에 쓰는 동안 인코딩 문제가 발생합니다. 이를 극복하려면 유니코드 객체를 최대한 많이 처리하는 것이 중요합니다.
유니코드 문자열 인코딩
문자열이 유니코드 객체(접두사 "로 표시됨)인 경우 u"(Python의 경우)), 파일에 쓰기 전에 유니코드로 인코딩된 문자열로 변환해야 합니다. 다음 형식을 사용하십시오.
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
이렇게 하면 ASCII가 아닌 문자가 파일에 올바르게 인코딩됩니다.
읽는 동안 디코딩
인코딩된 파일을 읽으면 유니코드로 인코딩된 문자열을 얻게 됩니다. 유니코드 개체를 검색하려면 해당 개체를 디코딩하세요.
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
이 단계를 따르면 파일에 쓰고 읽는 동안 유니코드 텍스트를 안전하게 처리하여 특수 문자와 기호를 보존할 수 있습니다.
위 내용은 Python에서 유니코드 텍스트 파일을 쓰고 읽는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!