Heim > Datenbank > MySQL-Tutorial > Wie führt man mit Elasticsearch einen Fuzzy-Abgleich von E-Mail-Adressen und Telefonnummern durch?

Wie führt man mit Elasticsearch einen Fuzzy-Abgleich von E-Mail-Adressen und Telefonnummern durch?

Linda Hamilton
Freigeben: 2024-11-01 05:33:27
Original
879 Leute haben es durchsucht

How to Perform Fuzzy Matching of Email Addresses and Telephone Numbers Using Elasticsearch?

Fuzzy-Matching von E-Mails oder Telefonnummern mit Elasticsearch

Elasticsearch bietet integrierte Funktionen für den Fuzzy-Matching von E-Mail-Adressen und Telefonnummern.

E-Mail-Matching

Um E-Mail-Adressen abzugleichen, die mit einer bestimmten Domain enden (z. B. @gmail.com):

<code class="json">{
    "query": {
        "term": {
            "email": ".*@gmail.com"
        }
    }
}</code>
Nach dem Login kopieren

Oder um E-Mails abzugleichen, die eine bestimmte Zeichenfolge enthalten:

<code class="json">{
    "query": {
        "match": {
            "email": {
                "query": "sales@*",
                "operator": "and"
            }
        }
    }
}</code>
Nach dem Login kopieren

Telefonabgleich

Für den Fuzzy-Abgleich von Telefonnummern können Sie das folgende Muster verwenden:

<code class="json">{
    "query": {
        "prefix": {
            "tel": "136*"
        }
    }
}</code>
Nach dem Login kopieren

Dadurch werden alle Telefonnummern abgeglichen, die mit „136“ beginnen.

Leistungsoptimierung

Um die Leistung für Fuzzy-Matching zu verbessern, sollten Sie die Verwendung benutzerdefinierter Analysatoren in Betracht ziehen, die N-Gramm- oder Edge-N-Gramm-Tokenfilter nutzen. Diese Filter zerlegen den Text in kleinere Token, was es Elasticsearch erleichtert, Fuzzy-Matching durchzuführen.

E-Mail-Analysator-Konfiguration:

<code class="json">{
  "settings": {
    "analysis": {
      "analyzer": {
        "email_analyzer": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "name_ngram_filter",
            "trim"
          ]
        }
      },
      "filter": {
        "name_ngram_filter": {
          "type": "ngram",
          "min_gram": "3",
          "max_gram": "20"
        }
      }
    }
  }
}</code>
Nach dem Login kopieren

Telefonanalysator Konfiguration:

<code class="json">{
  "settings": {
    "analysis": {
      "analyzer": {
        "phone_analyzer": {
          "type": "custom",
          "char_filter": [
            "digit_only"
          ],
          "tokenizer": "digit_edge_ngram_tokenizer",
          "filter": [
            "trim"
          ]
        }
      },
      "char_filter": {
        "digit_only": {
          "type": "pattern_replace",
          "pattern": "\D+",
          "replacement": ""
        }
      },
      "tokenizer": {
        "digit_edge_ngram_tokenizer": {
          "type": "edgeNGram",
          "min_gram": "3",
          "max_gram": "15",
          "token_chars": [
            "digit"
          ]
        }
      }
    }
  }
}</code>
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie führt man mit Elasticsearch einen Fuzzy-Abgleich von E-Mail-Adressen und Telefonnummern durch?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage