> Java > Java베이스 > 본문

Java는 텍스트 파일의 문자 인코딩 획득을 구현합니다.

王林
풀어 주다: 2019-12-23 11:49:49
앞으로
12157명이 탐색했습니다.

Java는 텍스트 파일의 문자 인코딩 획득을 구현합니다.

1. 문자 인코딩 이해:

1. Java에서 문자열의 기본 인코딩은 UTF-8이며 다음 명령문을 사용하여 얻을 수 있습니다. Charset.defaultCharset();

2 Windows 운영 체제에서 문자열의 기본 인코딩은 다음과 같습니다. 텍스트 파일은 ANSI입니다. 중국어 Windows의 경우 GBK입니다. 예를 들어 메모장 프로그램을 사용하여 새 텍스트 문서를 만드는 경우 기본 문자 인코딩은 ANSI입니다.

3. 텍스트 텍스트 문서에는 ANSI, 유니코드(유니코드 빅 엔디안 및 유니코드 리틀 엔디안 포함), UTF-8, UTF-16

4의 네 가지 인코딩 옵션이 있습니다. 따라서 txt 파일을 읽을 때 해당 인코딩을 알 수 없습니다. 형식을 사용하려면 txt 파일의 인코딩을 동적으로 결정하는 프로그램이 필요합니다.

ANSI: 형식 정의가 없습니다. 중국어 운영 체제의 경우 GBK 또는 GB2312

UTF-8입니다. 처음 3바이트는 0xE59B9E(UTF-8), 0xEFBBBF(BOM을 포함한 UTF-8)

UTF-16입니다. 처음 두 바이트는: 0xFEFF

유니코드: 처음 두 바이트는: 0xFFFE

예: 유니코드 문서는 0xFFFE로 시작합니다. 프로그램을 사용하여 처음 몇 바이트를 꺼내서 판단하세요.

5. Java 인코딩과 텍스트 인코딩 간의 대응:

Java는 텍스트 파일의 문자 인코딩 획득을 구현합니다.

Java는 텍스트 파일을 읽습니다. 인코딩 형식이 일치하지 않으면 잘못된 문자가 나타납니다. 따라서 텍스트 파일을 읽을 때 올바른 문자 인코딩을 설정해야 합니다. 텍스트 문서의 인코딩 형식은 파일 헤더에 기록됩니다. 프로그램에서 파일의 인코딩 형식을 먼저 구문 분석해야 합니다. 인코딩 형식을 얻은 후 이 형식으로 파일을 읽으면 문자가 깨지는 것을 방지할 수 있습니다.

무료 온라인 비디오 자습서 권장 사항 : java 학습

2. 예를 들면 다음과 같습니다. 추천 관련 기사 및 튜토리얼:

Java 학습 시작하기

위 내용은 Java는 텍스트 파일의 문자 인코딩 획득을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:csdn.net
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿