문자열에서 효율적인 문자 필터링
이 문서에서는 문자열에서 특수 문자를 효율적으로 제거하여 영숫자 문자만 포함되도록 하는 작업에 대해 설명합니다. 밑줄 및 점.
제공된 코드는 문자 유효성 검사를 위해 루프를 사용하는 방법을 검토합니다. 가장 효율적인 접근 방식이 아닐 수도 있습니다. 제안된 최적화에는 열거자를 사용하고 예상 용량으로 StringBuilder를 초기화하여 배열 액세스를 줄이는 것이 포함됩니다.
более 효율적인 옵션의 경우 정규식을 사용할 수 있지만 짧은 문자열의 경우 성능이 저하될 수 있습니다. 다음 정규식은 허용된 문자와 성공적으로 일치합니다.
[0-9A-Za-z._]+
그러나 이 시나리오에서는 조회 테이블이 문자열 조작 및 정규식보다 성능이 뛰어납니다. 조회 테이블은 각 문자의 허용 여부를 나타내는 부울 값을 저장하여 필터링 프로세스 속도를 크게 향상시킵니다.
조회 테이블을 통합하는 완전한 솔루션:
private static bool[] _lookup; static Program() { _lookup = new bool[65536]; for (char c = '0'; c <= '9'; c++) _lookup[c] = true; for (char c = 'A'; c <= 'Z'; c++) _lookup[c] = true; for (char c = 'a'; c <= 'z'; c++) _lookup[c] = true; _lookup['.'] = true; _lookup['_'] = true; } public static string RemoveSpecialCharacters(string str) { char[] buffer = new char[str.Length]; int index = 0; foreach (char c in str) { if (_lookup[c]) { buffer[index] = c; index++; } } return new string(buffer, 0, index); }
성능 테스트에 따르면 조회 테이블은 접근 방식은 24자 문자열의 실행 시간이 약 13밀리초로 루프 방법이나 정규 표현식보다 훨씬 빠릅니다.
위 내용은 문자열에서 특수 문자를 필터링하는 가장 효율적인 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!