Mengapa Sempadan Regex \\b Go Gagal dengan Aksara Bukan ASCII?

DDD
Lepaskan: 2024-10-29 00:26:02
asal
749 orang telah melayarinya

Why Does Go's Regex \b Boundary Fail with Non-ASCII Characters?

Isu Sempadan Regex Golang dengan Aksara Bukan ASCII

Dalam Go, pilihan sempadan b dijangka sepadan pada sempadan aksara ASCII , tidak termasuk aksara beraksen seperti é. Tingkah laku ini boleh membawa kepada hasil yang tidak dijangka apabila bekerja dengan rentetan yang mengandungi aksara bukan ASCII. Sebagai contoh, pertimbangkan kod berikut:

<code class="go">package main

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`\b(vis)\b`)
    fmt.Println(r.MatchString("re vis e")) // True
    fmt.Println(r.MatchString("revise")) // False
    fmt.Println(r.MatchString("révisé")) // True
}</code>
Salin selepas log masuk

Dalam contoh ini, regex b(vis)b sepadan dengan subrentetan "vis" pada sempadan perkataan. Walau bagaimanapun, apabila digunakan untuk "revisé", ia salah mengembalikan Benar kerana é tidak dianggap sebagai aksara perkataan. Untuk menangani isu ini, anda boleh menggunakan pendekatan alternatif:

<code class="go">r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
fmt.Println(r.MatchString("vis")) // True
fmt.Println(r.MatchString("re vis e")) // True
fmt.Println(r.MatchString("revise")) // False
fmt.Println(r.MatchString("révisé")) // False</code>
Salin selepas log masuk

Penyelesaian ini menggunakan kumpulan tidak menangkap (?:A|s)(vis)(?:s|z) untuk memadankan mana-mana aksara berikut:

  • Permulaan rentetan (A)
  • Ruang putih (s)

Ini meniru kelakuan b tetapi termasuk aksara bukan ASCII sebagai sempadan perkataan yang berpotensi. Dengan menggabungkan komponen ini, ia berjaya memadankan "vis" pada permulaan atau akhir perkataan, tanpa mengira aksara di sekelilingnya.

Atas ialah kandungan terperinci Mengapa Sempadan Regex \\b Go Gagal dengan Aksara Bukan ASCII?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!