원본 주소: 링크를 열려면 클릭하세요
오늘 Yuanzi 홈페이지에서 블로그 게시물을 봤습니다. 유니코드와 UTF-8에 대한 간략한 대화를 통해 알게 된 사실입니다. UTF-8은 Unicode One 구현 방법의 일부입니다.
유니코드는 전 세계의 모든 문자에 대해 통합된 이진수만 지정하고 프로그램이 이를 저장하고 구문 분석하는 방법을 지정하지 않습니다.
UTF-8은 유니코드 구현 방법 중 하나라고 할 수 있는데...
이번 수확물을 플래시 메모리에 기록하면서 @飞鸟_Asuka가 좋은 것을 언급했습니다. 답변 질문: "인코딩 방법을 선택할 때 유니코드와 utf8이 두 개의 별도 옵션인 이유는 무엇입니까?"
C#에서는 System.Text.Encoding.Unicode와 System.Text.Encoding.UTF8이 각각 2개 있습니다. 인코딩 방법. UTF-8이 유니코드의 구현 방법이라면 C#에서 UTF8과 병렬로 Encoding.Unicode가 인코딩 방법으로 사용되는 이유는 무엇입니까?
나중에 stackoverflow에서 답을 찾았습니다.
Windows의 기본 유니코드 구현은 UTF-16이므로 C#의 Encoding.Unicode는 UTF-16입니다. System.Text.Encoding.Unicode의 주석도 이를 증명합니다.Windows는 소위 "유니코드" 문자열을 UTF-16 문자열로 처리하는 반면, 요즘 대부분의 UNIX는 기본적으로 UTF-8을 사용합니다. 🎜>
// // Summary: // Gets an encoding for the UTF-16 format using the little endian byte order. // // Returns: // An encoding for the UTF-16 format using the little endian byte order.public static Encoding Unicode { get; }