Javascript RegExp: Wortgrenzen und Unicode-Zeichen
Bei der Verwendung von Javascripts RegExp für die automatische Vervollständigung ist der Umgang mit Sonderzeichen in Sprachen wie Finnisch von entscheidender Bedeutung. Der traditionelle Ansatz zum Abgleichen von Wortgrenzen (b) kann Zeichen wie ä, ö und å nicht verarbeiten.
Lösung: Unicode-Codes
Um dieses Problem zu beheben, haben wir kann Unicode-Codes für diese Sonderzeichen nutzen:
[\u00C4,\u00E4,\u00C5,\u00E5,\u00D6,\u00F6] => äÄåÅöÖ
Nicht erfassende Gruppe
Anstelle von b können wir eine nicht erfassende Gruppe verwenden, um den Anfang abzugleichen einer Zeichenfolge oder eines Leerzeichens. Dieser Ansatz ermöglicht es uns, Sonderzeichen effektiver zuzuordnen:
<code class="javascript">var pattern = "(?:^|\s)" + searchterm;</code>
Aufschlüsselung:
Beispiel:
<code class="javascript">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö"; var searchterm = "äl"; if (new RegExp(pattern, "gi").test(title)) { // Match found }</code>
Das obige ist der detaillierte Inhalt vonHier sind einige Titeloptionen unter Berücksichtigung des von Ihnen gewünschten „Frage-und-Antwort'-Formats: * Wie werden Wortgrenzen mit Sonderzeichen in JavaScript RegExp abgeglichen? * Autovervollständigung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!