ASCII 문자가 아닌 문자를 사용하는 Go regexp 경계: 정규식 수정
Golang의 일반 문자를 사용하여 작업할 때 ASCII가 아닌 문자를 다루는 것이 어려울 수 있습니다. 표현식(정규식). 특히 문자 경계와 일치하도록 설계된 "b" 경계 옵션은 "é"와 같은 라틴 문자를 만날 때 예상대로 작동하지 않을 수 있습니다. 이 문제는 "b"가 ASCII 문자로만 작동하기 때문에 발생합니다.
이 문제를 해결하려면 ASCII 이외의 더 넓은 범위의 문자를 포함하는 사용자 정의 경계를 생성할 수 있습니다. 해결 방법은 다음과 같습니다.
<code class="go">package main import ( "fmt" "regexp" ) func main() { r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`) fmt.Println(r.MatchString("vis")) // Handle case without boundary fmt.Println(r.MatchString("re vis e")) fmt.Println(r.MatchString("revise")) fmt.Println(r.MatchString("révisé")) }</code>
설명:
이 수정된 정규식은 다음 대체를 사용합니다.
이를 통해 문자열의 시작 부분, 문자열 끝 부분 또는 공백 문자에서 경계를 일치시킬 수 있습니다. "é"와 같은 라틴 문자는 이제 일반 문자로 간주되며 잘못된 경계 일치를 트리거하지 않습니다.
경계 옵션을 수정하면 Go의 정규 표현식에서 라틴 문자와 기타 비ASCII 문자를 효과적으로 처리할 수 있으므로 정확성이 보장됩니다. 일치하는 행동.
위 내용은 Go Regex 경계를 사용하여 비ASCII 문자를 처리하는 방법: \'é\' 및 그 이상에 대한 솔루션?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!