> Java > Java베이스 > 본문

txt 파일을 읽는 Java의 잘못된 문자에 대한 솔루션

풀어 주다: 2019-11-30 09:38:32
원래의
6931명이 탐색했습니다.

txt 파일을 읽는 Java의 잘못된 문자에 대한 솔루션

Java는 txt 파일을 읽습니다. 인코딩 형식이 일치하지 않으면 잘못된 문자가 나타납니다. 따라서 txt 파일을 읽을 때에는 읽기 인코딩을 설정해야 합니다. txt 문서의 인코딩 형식은 파일 헤더에 기록됩니다. 프로그램에서는 먼저 파일의 인코딩 형식을 구문 분석해야 합니다. 인코딩 형식을 얻은 후 이 형식의 파일을 읽어도 잘못된 문자가 생성되지 않습니다. (권장: java 비디오 튜토리얼)

Java 인코딩은 txt 인코딩에 해당합니다:

txt 파일을 읽는 Java의 잘못된 문자에 대한 솔루션

예:

package com.lfl.attachment;  
  
import java.io.BufferedReader;  
import java.io.File;  
import java.io.FileInputStream;  
import java.io.InputStream;  
import java.io.InputStreamReader;  
  
public class TextMain {  
  
    public static void main(String[] args) throws Exception {  
        String filePath = "D:/article.txt";  
//      String filePath = "D:/article333.txt";    
//      String filePath = "D:/article111.txt";    
        String content = readTxt(filePath);  
        System.out.println(content);  
          
    }  
  
      
      
    /** 
     * 解析普通文本文件  流式文件 如txt 
     * @param path 
     * @return 
     */  
    @SuppressWarnings("unused")  
    public static String readTxt(String path){  
        StringBuilder content = new StringBuilder("");  
        try {  
            String code = resolveCode(path);  
            File file = new File(path);  
            InputStream is = new FileInputStream(file);  
            InputStreamReader isr = new InputStreamReader(is, code);  
            BufferedReader br = new BufferedReader(isr);  
//          char[] buf = new char[1024];  
//          int i = br.read(buf);  
//          String s= new String(buf);  
//          System.out.println(s);  
            String str = "";  
            while (null != (str = br.readLine())) {  
                content.append(str);  
            }  
            br.close();  
        } catch (Exception e) {  
            e.printStackTrace();  
            System.err.println("读取文件:" + path + "失败!");  
        }  
        return content.toString();  
    }  
      
      
      
    public static String resolveCode(String path) throws Exception {  
//      String filePath = "D:/article.txt"; //[-76, -85, -71]  ANSI  
//      String filePath = "D:/article111.txt";  //[-2, -1, 79] unicode big endian  
//      String filePath = "D:/article222.txt";  //[-1, -2, 32]  unicode  
//      String filePath = "D:/article333.txt";  //[-17, -69, -65] UTF-8  
        InputStream inputStream = new FileInputStream(path);    
        byte[] head = new byte[3];    
        inputStream.read(head);      
        String code = "gb2312";  //或GBK  
        if (head[0] == -1 && head[1] == -2 )    
            code = "UTF-16";    
        else if (head[0] == -2 && head[1] == -1 )    
            code = "Unicode";    
        else if(head[0]==-17 && head[1]==-69 && head[2] ==-65)    
            code = "UTF-8";    
            
        inputStream.close();  
          
        System.out.println(code);   
        return code;  
    }  
      
}
로그인 후 복사

참고:solveTxt 메소드에서, InputStream 스트림은 readTxt 메소드를 통해 전달될 수 없습니다. 보유할 두 가지 메소드 동일한 스트림 참조가 있지만 스트림의 3바이트는 readTxt에서 읽을 때 스트림의 시작 위치가 아닌 3입니다. 읽기 오류.

더 많은 Java 지식을 알고 싶다면 java 기본 튜토리얼 칼럼을 주목해주세요.

위 내용은 txt 파일을 읽는 Java의 잘못된 문자에 대한 솔루션의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿