1. 문자 인코딩 이해:
1. Java에서 문자열의 기본 인코딩은 UTF-8이며 다음 명령문을 사용하여 얻을 수 있습니다. Charset.defaultCharset();
2 Windows 운영 체제에서 문자열의 기본 인코딩은 다음과 같습니다. 텍스트 파일은 ANSI입니다. 중국어 Windows의 경우 GBK입니다. 예를 들어 메모장 프로그램을 사용하여 새 텍스트 문서를 만드는 경우 기본 문자 인코딩은 ANSI입니다.
3. 텍스트 텍스트 문서에는 ANSI, 유니코드(유니코드 빅 엔디안 및 유니코드 리틀 엔디안 포함), UTF-8, UTF-16
4의 네 가지 인코딩 옵션이 있습니다. 따라서 txt 파일을 읽을 때 해당 인코딩을 알 수 없습니다. 형식을 사용하려면 txt 파일의 인코딩을 동적으로 결정하는 프로그램이 필요합니다.
ANSI: 형식 정의가 없습니다. 중국어 운영 체제의 경우 GBK 또는 GB2312
UTF-8입니다. 처음 3바이트는 0xE59B9E(UTF-8), 0xEFBBBF(BOM을 포함한 UTF-8)
UTF-16입니다. 처음 두 바이트는: 0xFEFF
유니코드: 처음 두 바이트는: 0xFFFE
예: 유니코드 문서는 0xFFFE로 시작합니다. 프로그램을 사용하여 처음 몇 바이트를 꺼내서 판단하세요.
5. Java 인코딩과 텍스트 인코딩 간의 대응:
Java는 텍스트 파일을 읽습니다. 인코딩 형식이 일치하지 않으면 잘못된 문자가 나타납니다. 따라서 텍스트 파일을 읽을 때 올바른 문자 인코딩을 설정해야 합니다. 텍스트 문서의 인코딩 형식은 파일 헤더에 기록됩니다. 프로그램에서 파일의 인코딩 형식을 먼저 구문 분석해야 합니다. 인코딩 형식을 얻은 후 이 형식으로 파일을 읽으면 문자가 깨지는 것을 방지할 수 있습니다.
무료 온라인 비디오 자습서 권장 사항 : java 학습
2. 예를 들면 다음과 같습니다. 추천 관련 기사 및 튜토리얼:
Java 학습 시작하기위 내용은 Java는 텍스트 파일의 문자 인코딩 획득을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!