Mit der Entwicklung des Internets sind Unternehmen mit immer größeren Mengen an Textdaten konfrontiert. Das schnelle und genaue Abrufen relevanter Inhalte ist für Unternehmen im Informationsbereich zu einem wichtigen Thema geworden. Als Open-Source-Suchmaschine auf Basis von Lucene zeichnet sich Elasticsearch durch hohe Verfügbarkeit, hohe Skalierbarkeit und schnelles Abrufen aus und ist damit eine der bevorzugten Lösungen für die Volltextsuche in Unternehmen. Als beliebte serverseitige Programmiersprache kann PHP auch schnell Webentwicklung und API-Entwicklung durchführen und ist zu einer der am häufigsten verwendeten Sprachen geworden, die in Elasticsearch integriert sind.
In diesem Artikel werden hauptsächlich die detaillierten Schritte der Integration von PHP und Elasticsearch zur Realisierung der Volltextsuchfunktion erläutert.
1. Einführung in Elasticsearch
Elasticsearch ist eine auf Lucene basierende Open-Source-Suchmaschine, mit der große Mengen an Textdaten schnell und genau abgerufen werden können. Elasticsearch verwendet eine verteilte Speicherarchitektur, unterstützt die horizontale Erweiterung und kann sich an die Anforderungen einer massiven Datenspeicherung und eines schnellen Abrufs anpassen.
Elasticsearch bietet eine RESTful-API-Schnittstelle, unterstützt die Dateninteraktion im JSON-Format und kann in häufig verwendete Programmiersprachen integriert werden. In Elasticsearch werden Daten nach Dokumenten gespeichert. Jedes Dokument enthält mehrere Felder, und jedes Feld kann so verschachtelt werden, dass es andere Felder enthält, wodurch die Datenstruktur flexibler wird. Gleichzeitig unterstützt Elasticsearch den Volltextabruf, den genauen Abgleich, die Aggregation, die Analyse und andere Vorgänge an Dokumenten.
2. PHP- und Elasticsearch-Integration
Elasticsearch-PHP ist die offizielle PHP-Client-Bibliothek, die die RESTful-API-Schnittstelle von Elasticsearch kapselt und Elasticsearch problemlos in PHP-Anwendungen betreiben kann. Wir können die Bibliothek über Composer installieren und den folgenden Befehl ausführen:
composer require elasticsearch/elasticsearch
Bevor Sie eine Verbindung zu Elasticsearch herstellen, müssen Sie den Elasticsearch-Dienst starten. Um die Elasticsearch-PHP-Bibliothek zum Herstellen einer Verbindung zu Elasticsearch in PHP zu verwenden, müssen Sie zuerst das ElasticsearchClient-Objekt instanziieren und die IP und den Port des verbundenen Elasticsearch-Servers festlegen:
require 'vendor/autoload.php'; $client = ElasticsearchClientBuilder::create()->setHosts(['http://127.0.0.1:9200'])->build();
Unter diesen übergibt die Methode setHosts() einen Array-Parameter: Jedes Element stellt einen Elasticsearch-Server dar. Es können mehrere Server eingerichtet werden, um eine hohe Verfügbarkeit und einen Lastausgleich zu erreichen.
In Elasticsearch ist ein Index eine Datenstruktur, die zum Speichern und Abrufen ähnlicher Daten verwendet wird, ähnlich einer Tabelle in einer Datenbank. Sie können einen Index mit dem Namen „my_index“ über den folgenden Code erstellen:
$params = [ 'index' => 'my_index', 'body' => [ 'settings' => [ 'number_of_shards' => 5, // 分片数 'number_of_replicas' => 1, // 副本数 ], ], ]; $response = $client->indices()->create($params);
Unter anderem stellt „settings“ im Array-Parameter $params die Einstellungen des Index dar, einschließlich Informationen wie der Anzahl der Shards und der Anzahl der Kopien . 'body' stellt die Zuordnung des Index dar. In diesem Parameter können Sie die Felder und Typen des Index festlegen.
Das Hinzufügen eines Dokuments in Elasticsearch kann durch den folgenden Code erreicht werden:
$params = [ 'index' => 'my_index', 'id' => '1', 'body' => [ 'title' => 'Elasticsearch PHP集成', 'content' => 'Elasticsearch是一款基于Lucene的开源搜索引擎...' ] ]; $response = $client->index($params);
Dabei stellt „index“ im Array-Parameter $params den Indexnamen des hinzuzufügenden Dokuments dar. „id“ stellt die eindeutige Kennung des Dokuments dar, der optionale Parameter „body“ stellt den Inhalt des Dokuments dar und es können mehrere Felder und Werte festgelegt werden.
Die Suche nach Dokumenten in Elasticsearch kann über den folgenden Code erfolgen:
$params = [ 'index' => 'my_index', 'body' => [ 'query' => [ 'match' => [ 'title' => 'Elasticsearch PHP' ] ] ] ]; $response = $client->search($params);
Dabei stellt „index“ im Array-Parameter $params den Indexnamen des zu durchsuchenden Dokuments dar. body' stellt die Abfragebedingung dar, die mehrere Abfragebedingungen und Sortierregeln festlegen kann.
3. PHP+Elasticsearch zum Implementieren des Volltextabrufs
Bevor Sie Elasticsearch zum Implementieren des Volltextabrufs verwenden, müssen die abzurufenden Daten zuerst indiziert werden. Beim Erstellen eines Index können Sie das abzurufende Feld auf den Texttyp festlegen, sodass eine Volltextindizierung durchgeführt werden kann.
In diesem Beispiel wird davon ausgegangen, dass es sich bei den abzurufenden Daten um eine Schülertabelle handelt, die die Felder ID, Name, Alter und Punktzahl enthält. Mit dem folgenden Code können wir einen Index mit dem Namen „Student“ erstellen:
$params = [ 'index' => 'student', 'body' => [ 'settings' => [ 'number_of_shards' => 5, 'number_of_replicas' => 1, ], 'mappings' => [ 'properties' => [ 'id' => ['type' => 'integer'], 'name' => ['type' => 'text', 'analyzer' => 'ik_max_word'], 'age' => ['type' => 'integer'], 'score' => ['type' => 'double'] ] ] ] ]; $response = $client->indices()->create($params);
Darunter wird der Typ des Felds „Name“ auf Text festgelegt und ein Wortsegmentierer angegeben. Das chinesische Wortsegmentierungs-Plug-in ik_max_word wird verwendet Hier wird der chinesische Text gemäß der maximal verarbeiteten Wortsegmentierung konvertiert.
Nachdem der Index erstellt wurde, können Sie Dokumente zum Index hinzufügen. Angenommen, Sie möchten Schülerinformationen hinzufügen, was durch den folgenden Code erreicht werden kann:
$params = [ 'index' => 'student', 'body' => [ 'id' => 1, 'name' => '张三', 'age' => 18, 'score' => 90.5 ] ]; $response = $client->index($params);
Durch Schleifenaddition können dem Index mehrere Dokumente hinzugefügt werden.
Nach der Indizierung und dem Hinzufügen von Dokumenten ist eine Volltextsuche möglich. In diesem Beispiel wird eine Übereinstimmungsabfrage verwendet, um eine Volltextsuche zu erreichen, die durch Eingabe von Schlüsselwörtern durchsucht werden kann. Dies kann durch den folgenden Code erreicht werden:
$params = [ 'index' => 'student', 'body' => [ 'query' => [ 'match' => [ 'name' => '张三' ] ] ] ]; $response = $client->search($params);
Darunter wird das Feld „Name“ für den Abgleich verwendet und kann durch andere Felder ersetzt werden, die einen Volltextabruf erfordern. Die von den Suchergebnissen zurückgegebenen Informationen befinden sich in $response, und die Abfrageergebnisse können abgerufen und angezeigt werden.
4. Zusammenfassung
In diesem Artikel werden die detaillierten Schritte zur Integration von PHP und Elasticsearch zur Realisierung der Volltextsuchfunktion vorgestellt. Durch die Schritte Herstellen einer Verbindung zu Elasticsearch, Erstellen von Indizes, Hinzufügen von Dokumenten und Durchsuchen von Dokumenten können Sie große Mengen an Textdaten schnell und genau abrufen. Bei der Durchführung einer Volltextsuche wird empfohlen, einen Wortsegmentierer zum Segmentieren von Chinesisch zu verwenden, um die Suchgenauigkeit und -effizienz zu verbessern.
Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Integration von PHP und Elasticsearch zur Realisierung der Volltextsuchfunktion. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!