Go Regex 경계를 사용하여 비ASCII 문자를 처리하는 방법: \'é\' 및 그 이상에 대한 솔루션?

Patricia Arquette
풀어 주다: 2024-10-30 10:17:02
원래의
1002명이 탐색했습니다.

How to Handle Non-ASCII Characters with Go Regex Boundaries: A Solution for

ASCII 문자가 아닌 문자를 사용하는 Go regexp 경계: 정규식 수정

Golang의 일반 문자를 사용하여 작업할 때 ASCII가 아닌 문자를 다루는 것이 어려울 수 있습니다. 표현식(정규식). 특히 문자 경계와 일치하도록 설계된 "b" 경계 옵션은 "é"와 같은 라틴 문자를 만날 때 예상대로 작동하지 않을 수 있습니다. 이 문제는 "b"가 ASCII 문자로만 작동하기 때문에 발생합니다.

이 문제를 해결하려면 ASCII 이외의 더 넓은 범위의 문자를 포함하는 사용자 정의 경계를 생성할 수 있습니다. 해결 방법은 다음과 같습니다.

<code class="go">package main

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
    fmt.Println(r.MatchString("vis")) // Handle case without boundary
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}</code>
로그인 후 복사

설명:

이 수정된 정규식은 다음 대체를 사용합니다.

  • "b"가 대체됩니다. "(?:A|s)(?:s|z)"를 사용합니다.
  • "A"는 문자열의 시작을 나타냅니다.
  • "z"는 문자열의 끝을 나타냅니다.
  • "s"는 공백을 나타냅니다.

이를 통해 문자열의 시작 부분, 문자열 끝 부분 또는 공백 문자에서 경계를 일치시킬 수 있습니다. "é"와 같은 라틴 문자는 이제 일반 문자로 간주되며 잘못된 경계 일치를 트리거하지 않습니다.

경계 옵션을 수정하면 Go의 정규 표현식에서 라틴 문자와 기타 비ASCII 문자를 효과적으로 처리할 수 있으므로 정확성이 보장됩니다. 일치하는 행동.

위 내용은 Go Regex 경계를 사용하여 비ASCII 문자를 처리하는 방법: \'é\' 및 그 이상에 대한 솔루션?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!