바이트 배열을 문자열로 변환했다가 다시 바이트 배열로 변환할 때 발생하는 문제
이 주제에 대한 수많은 논의에도 불구하고 일부에게는 지속적인 문제가 남아 있습니다. 일치하지 않는 바이트 배열이 발생하지 않고 바이트 배열을 문자열로 변환하고 다시 바이트 배열로 변환합니다. 개인이 암호화된 데이터를 바이트 배열이 아닌 문자열로 조작하려고 시도할 때 문제가 발생합니다.
제공된 코드 예제에서 바이트 배열을 사용할 때 암호화 및 복호화 프로세스가 원활하게 작동합니다. 그러나 바이트 배열을 문자열로 변환하거나 그 반대로 변환하면 결과 바이트 배열이 원본과 다릅니다. 결과적으로 암호 해독 프로세스가 실패합니다. UTF-8 및 UTF-16을 포함한 여러 문자열 인코딩이 테스트되었지만 성공하지 못했습니다.
불일치 이해
근본적인 문제는 문자열의 특성에서 비롯됩니다. 및 바이트 배열. 문자열은 원시 이진 데이터가 아닌 사람이 읽을 수 있는 텍스트를 나타내도록 설계되었습니다. 암호화된 데이터를 문자열로 저장하면 불일치가 발생할 수 있습니다.
데이터 손실 방지
변환 중 데이터 손실을 방지하려면 1을 유지하는 인코딩을 사용하는 것이 중요합니다. 바이트와 문자 간의 일대일 매핑입니다. 그러한 인코딩 중 하나가 ISO-8859-1입니다. 이는 모든 바이트 시퀀스가 특정 문자 시퀀스에 해당하고 그 반대도 보장됩니다.
ISO-8859-1로 최적화된 코드
두 가지 주요 이유로 실패하는 UTF-16 문제를 해결하기 위해 다음 발췌 코드에서는 ISO-8859-1:
String decoded = new String(encryptedByteArray, "ISO-8859-1"); System.out.println("decoded:" + decoded); byte[] encoded = decoded.getBytes("ISO-8859-1"); System.out.println("encoded:" + java.util.Arrays.toString(encoded)); String decryptedText = encrypter.decrypt(encoded);
위 내용은 바이트 배열을 문자열로 변환하고 그 반대로 변환하면 데이터가 손실되는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!