백엔드 개발 C++ C#에서 문자열의 인코딩을 안정적으로 결정하려면 어떻게 해야 합니까?

C#에서 문자열의 인코딩을 안정적으로 결정하려면 어떻게 해야 합니까?

Jan 20, 2025 pm 07:23 PM

How Can I Reliably Determine the Encoding of a String in C#?

C#에서 문자열 인코딩을 결정하는 안정적인 방법

파일이나 파일 이름과 같은 소스의 문자열을 처리할 때 인코딩을 알 수 없는 상황에 자주 직면하게 됩니다. 이 경우 데이터를 올바르게 표시하고 해석하려면 코딩을 올바르게 결정하는 것이 중요합니다. C#에서는 이 문제를 해결하는 여러 가지 방법을 제공합니다.

Encoding.DetectEncoding 사용

Encoding.DetectEncoding 메서드는 기본적인 인코딩 감지 기능을 제공합니다. 바이트 패턴의 통계적 분석을 기반으로 인코딩을 식별하려고 시도합니다. 그러나 이 방법은 완전히 신뢰할 수 없으며 경우에 따라 실패할 수도 있습니다.

Encoding encoding = Encoding.DetectEncoding(bytes);
로그인 후 복사

사용자 정의 인코딩 감지

보다 정확한 인코딩 감지를 위해 맞춤 구현을 생성할 수 있습니다. 이러한 방법에는 일반적으로 바이트 패턴, BOM(Byte Order Mark) 및 기타 경험적 방법을 확인하여 인코딩을 결정하는 작업이 포함됩니다. 다음은 맞춤 감지 방법의 예입니다.

public static Encoding DetectEncoding(byte[] bytes)
{
    // 检查 UTF-8 BOM
    if (bytes.Length >= 3 && bytes[0] == 0xEF && bytes[1] == 0xBB && bytes[2] == 0xBF)
    {
        return Encoding.UTF8;
    }
    // 检查 UTF-16 BOM
    else if (bytes.Length >= 2 && bytes[0] == 0xFF && bytes[1] == 0xFE)
    {
        return Encoding.Unicode;
    }
    else if (bytes.Length >= 2 && bytes[0] == 0xFE && bytes[1] == 0xFF)
    {
        return Encoding.BigEndianUnicode;
    }
    // 检查 UTF-32 BOM
    else if (bytes.Length >= 4 && bytes[0] == 0x00 && bytes[1] == 0x00 && bytes[2] == 0xFE && bytes[3] == 0xFF)
    {
        return Encoding.UTF32;
    }
    else if (bytes.Length >= 4 && bytes[0] == 0xFF && bytes[1] == 0xFE && bytes[2] == 0x00 && bytes[3] == 0x00)
    {
        return Encoding.UTF32;
    }
    // 检查 UTF-7 BOM
    else if (bytes.Length >= 3 && bytes[0] == 0x2B && bytes[1] == 0x2F && bytes[2] == 0x76)
    {
        return Encoding.UTF7;
    }
    // 使用默认编码
    else
    {
        return Encoding.Default;
    }
}
로그인 후 복사

요약

C#에서 문자열 인코딩을 결정하려면 기본 제공 방법의 한계와 사용자 지정 검색 방법의 잠재적 이점을 신중하게 고려해야 합니다. 위의 기술을 사용하여 개발자는 문자열 인코딩 감지 코드의 정확성과 신뢰성을 향상시킬 수 있습니다.

위 내용은 C#에서 문자열의 인코딩을 안정적으로 결정하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

C 언어 함수에 의해 반환 된 값 유형은 무엇입니까? 반환 값을 결정하는 것은 무엇입니까? C 언어 함수에 의해 반환 된 값 유형은 무엇입니까? 반환 값을 결정하는 것은 무엇입니까? Mar 03, 2025 pm 05:52 PM

C 언어 함수에 의해 반환 된 값 유형은 무엇입니까? 반환 값을 결정하는 것은 무엇입니까?

Gulc : C 도서관은 처음부터 구축되었습니다 Gulc : C 도서관은 처음부터 구축되었습니다 Mar 03, 2025 pm 05:46 PM

Gulc : C 도서관은 처음부터 구축되었습니다

C 언어 함수 형식 문자 케이스 변환 단계 C 언어 함수 형식 문자 케이스 변환 단계 Mar 03, 2025 pm 05:53 PM

C 언어 함수 형식 문자 케이스 변환 단계

C 언어 기능의 정의 및 호출 규칙은 무엇이며 C 언어 기능의 정의 및 호출 규칙은 무엇이며 Mar 03, 2025 pm 05:53 PM

C 언어 기능의 정의 및 호출 규칙은 무엇이며

메모리에 저장된 C 언어 함수의 반환 값은 어디에 있습니까? 메모리에 저장된 C 언어 함수의 반환 값은 어디에 있습니까? Mar 03, 2025 pm 05:51 PM

메모리에 저장된 C 언어 함수의 반환 값은 어디에 있습니까?

뚜렷한 사용 및 문구 공유 뚜렷한 사용 및 문구 공유 Mar 03, 2025 pm 05:51 PM

뚜렷한 사용 및 문구 공유

STL (정렬, 찾기, 변환 등)의 알고리즘을 효율적으로 사용하려면 어떻게합니까? STL (정렬, 찾기, 변환 등)의 알고리즘을 효율적으로 사용하려면 어떻게합니까? Mar 12, 2025 pm 04:52 PM

STL (정렬, 찾기, 변환 등)의 알고리즘을 효율적으로 사용하려면 어떻게합니까?

C 표준 템플릿 라이브러리 (STL)는 어떻게 작동합니까? C 표준 템플릿 라이브러리 (STL)는 어떻게 작동합니까? Mar 12, 2025 pm 04:50 PM

C 표준 템플릿 라이브러리 (STL)는 어떻게 작동합니까?

See all articles