C# 문자열 비교에서 악센트 문자 무시
C#에서는 철자는 같지만 액센트가 다른 문자열은 일반적으로 다른 엔터티로 처리됩니다. 문자열 동일성 비교에서 악센트를 무시해야 할 때 문제가 발생할 수 있습니다.
이 문제를 해결하기 위해 RemoveDiacritics
함수는 입력 문자열을 NormalizationForm.FormD
으로 정규화하고 공백이 없는 모든 표시를 제거하여 문자에서 모든 악센트를 효과적으로 제거합니다. 그런 다음 결과 문자열은 NormalizationForm.FormC
으로 정규화되어 원래 대소문자 구분을 복원합니다.
<code class="language-csharp">static string RemoveDiacritics(string text) { string formD = text.Normalize(NormalizationForm.FormD); StringBuilder sb = new StringBuilder(); foreach (char ch in formD) { UnicodeCategory uc = CharUnicodeInfo.GetUnicodeCategory(ch); if (uc != UnicodeCategory.NonSpacingMark) { sb.Append(ch); } } return sb.ToString().Normalize(NormalizationForm.FormC); }</code>
이 기능은 악센트가 있는 문자(예: "é")를 악센트가 없는 해당 문자(예: "e")로 효과적으로 변환합니다. NormalizationForm.FormD
의 NormalizationForm.FormC
, Normalize
을 사용하면 대소문자 구분을 유지하면서 악센트 표시를 제거할 수 있습니다.
예를 들어, 다음 코드는 RemoveDiacritics
함수를 사용하여 악센트를 무시하면서 문자열을 비교하는 방법을 보여줍니다.
<code class="language-csharp">string s1 = "hello"; string s2 = "héllo"; string s1NoDiacritics = RemoveDiacritics(s1); string s2NoDiacritics = RemoveDiacritics(s2); Console.WriteLine(s1NoDiacritics == s2NoDiacritics); // 输出:True</code>
이 예에서 악센트를 고려하지 않으면 s1과 s2가 다른 것으로 간주됩니다. 그러나 악센트 표시를 제거하면 s1NoDiacritics와 s2NoDiacritics가 동일해지며 비교 결과가 True가 됩니다.
위 내용은 악센트를 무시하면서 C#의 문자열을 어떻게 비교할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!