정규 표현식을 사용하여 단어를 일치시킬 때 b 경계 패턴은 때때로 예상치 못한 결과를 생성할 수 있으며, 특히 단어에 특수 문자가 포함된 경우 더욱 그렇습니다.
"Test Sortesindex[persons]{Sortes} text"라는 문구를 생각해 보세요. b
공식적으로 b는 단어 문자(w)와 비단어 문자 사이의 경계와 일치합니다. (W) 또는 문자열의 시작/끝입니다. 단어 경계 패턴 바로 뒤에 [ 또는 }와 같은 특수 문자가 오는 경우 b에는 특수 문자 뒤에 단어 문자만 있으면 됩니다.
해결 방법 이번 호에서는 적응어 경계 또는 모호하지 않은 단어 경계를 사용할 수 있습니다.
적응 단어 경계 경계 패턴 양쪽에 있는 단어와 단어가 아닌 문자의 모든 조합을 처리합니다.
re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
명확한 단어 경계 패턴 양쪽에 단어 문자가 필요하지 않습니다.
re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
적응형 단어 경계는 더욱 다양해졌습니다. 그러나 단어가 아닌 문자의 앞뒤에는 허용됩니다. 명확한 단어 경계는 더 엄격하여 주변 단어 문자가 없도록 보장합니다.
적응적이고 명확한 단어 경계에 사용되는 둘러보기 패턴은 일치 작업의 특정 요구 사항에 따라 사용자 정의할 수 있습니다. 예를 들어, 패턴 주위에 문자가 아닌 문자만 일치시키려면 w 대신 [^Wd_]를 사용하세요.
위 내용은 정규식 단어 경계(\b)가 특수 문자와 함께 잘못 동작하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!