정규식을 사용하여 문자열에서 전체 단어를 동적으로 일치
문자열에서 전체 단어를 일치시키려면 동적 정규식을 활용할 수 있습니다. 다음 시나리오를 고려하십시오.
문장의 단어는 공백으로 구분되지만 구두점은 양쪽에 나타날 수 있습니다. 문자열 중간에 있는 단어를 식별하기 위해 다음 패턴은 부분적인 단어 일치를 효과적으로 방지하고 구두점을 허용합니다.
match_middle_words = " [^a-zA-Z\d ]{0,}" + word + "[^a-zA-Z\d ]{0,} "
그러나 이 패턴은 선행 또는 공백이 없기 때문에 첫 번째 또는 마지막 단어와 일치하지 않습니다. 후행 공백. 이 문제를 해결하기 위해 추가 패턴을 사용할 수 있습니다.
match_starting_word = "^[^a-zA-Z\d]{0,}" + word + "[^a-zA-Z\d ]{0,} " match_end_word = " [^a-zA-Z\d ]{0,}" + word + "[^a-zA-Z\d]{0,}$"
이러한 패턴을 결합하여 다음 문자열을 얻습니다.
match_string = match_middle_words + "|" + match_starting_word +"|" + match_end_word
이 접근 방식을 사용하면 단어가 단어가 포함된 경우에만 캡처됩니다. 단어가 아닌 문자로 둘러싸여 있습니다. 또한 문자열의 시작과 끝 부분에 있는 단어를 처리합니다.
이 프로세스를 단순화하기 위해 b로 표시되는 단어 경계를 활용할 수 있습니다. 이러한 경계는 문자열의 시작과 끝에서 일치하므로 첫 번째 단어와 마지막 단어에 대해 별도의 패턴이 필요하지 않습니다. 다음 패턴은 전체 단어와 효율적으로 일치합니다.
match_string = r'\b' + word + r'\b'
이 패턴은 단어 목록과 일치하도록 쉽게 수정할 수 있습니다.
words_list = ['word1', 'word2', 'word3'] match_string = r'\b(?:{})'.format('|'.join(words_list))
단어 경계를 활용하면 세 가지 단어가 필요하지 않습니다. 패턴을 분리하고 동적 정규식을 사용하여 문자열의 전체 단어를 일치시키는 프로세스를 단순화합니다.
위 내용은 정규식을 사용하여 문자열의 전체 단어를 어떻게 동적으로 일치시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!