PHP 開発: Elasticsearch を使用して全文検索を実装する方法
最新の Web アプリケーションでは、データ量がますます増大していますが、ユーザーの期待とデータへのアクセスも同様に増大しています。したがって、ユーザーの期待に応え、より良いユーザー エクスペリエンスを提供するために、検索テクノロジーの重要性がますます高まっています。全文検索は、大量のデータのインデックス作成、検索、並べ替えを迅速に行うことができる強力なテクノロジです。この点において、Elasticsearch は、多くの高度な機能、高可用性、容易なスケーラビリティ、その他の利点を提供する主要なオープンソース検索エンジンです。
この記事では、Elasticsearchを使用してPHPで全文検索を実現する方法を紹介します。 Elasticsearch や PHP のインストールなどの環境設定から始め、インデックス作成、検索、分析の 3 つの主要な側面から詳しく説明します。
1. 環境設定
まず、Elasticsearch をローカルまたはサーバーにインストールします。 Elasticsearch は、公式 Web サイトまたはパッケージ マネージャーからダウンロードしてインストールできます。
2 番目に、Composer を介して Elasticsearch の PHP クライアント (elasticsearch-php) をインストールします。これには、Elasticsearch API を呼び出すための便利なメソッドとクラスが多数用意されています。
composer require elasticsearch/elasticsearch
インストールが完了したら、PHP ファイルで次の設定を行います:
require 'vendor/autoload.php';
$client = ElasticsearchClientBuilder::create()->build();
このようにして、Elasticsearch サーバーと通信するクライアントが作成されます。
2. インデックス
Elasticsearch では、インデックスはデータを保存し、迅速に検索するために使用されるデータ コレクションです。 elasticsearch-php の API を使用してインデックスにデータを挿入できます。
- インデックスの作成
まず、新しいインデックスを作成する必要があります。次のコードを使用して、「my_index」という名前のインデックスに「my_type」という名前の型を作成します。
#$params = ['index' => 'my_index', 'body' => [ 'mappings' => [ 'my_type' => [ 'properties' => [ 'title' => ['type' => 'text'], 'body' => ['type' => 'text'], ] ] ] ]
# #「properties」配列の「title」フィールドと「body」フィールドは「text」タイプであり、全文インデックスが付けられることを意味します。実際には、特定のニーズに応じてインデックスとフィールド タイプを設定します。
このようにして、「my_index」という名前のインデックスが正常に作成されました。
ドキュメント データをインデックスに追加します- 次のコードを使用してドキュメントをインデックスに挿入します:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'body' => [ 'title' => 'PHP Elasticsearch 全文检索', 'body' => 'Elasticsearch 是一个领先的全文搜索引擎,其功能包括分布式、高可用、实时搜索和分析能力等。', ]
];
$response = $client->index($params);
ここでは、タイトルと本文を含むドキュメントをインデックスに挿入します。
ドキュメントの更新- インデックス内の既存のドキュメントを更新する必要がある場合は、次のコードを使用します:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'id' => '1', 'body' => [ 'doc' => [ 'title' => '修改后的标题', 'body' => '修改后的正文内容', ] ]
];
$response = $client->update($params);
更新時にドキュメントの ID を指定する必要があることに注意してください。
ドキュメントの削除- 既存のドキュメントを削除する必要がある場合は、次のコードを使用します:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'id' => '1'
] ;
$response = $client->delete($params);
このようにして、インデックスとドキュメントの作成、挿入、更新、削除が完了しました。
3. 検索
elasticsearch-php API を使用して検索する方法を見てみましょう。
単純なクエリ- まず、単純なクエリを実行しましょう:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'body' => [ 'query' => [ 'match' => [ 'title' => 'PHP' ] ] ]
];
$response = $client->search($params);
上記のコードでは、一致クエリを実行して、インデックス内の "PHP" キーワードを含むすべてのドキュメントをクエリします。検索結果は $response 変数に保存されます。
複数条件クエリ- 複数の条件をクエリする必要がある場合は、bool クエリを使用して複数の条件を組み合わせることができます:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'body' => [ 'query' => [ 'bool' => [ 'must' => [ [ 'match' => [ 'title' => 'PHP' ] ], [ 'match' => [ 'body' => '搜索引擎' ] ] ] ] ] ]
];
$response = $client->search($params);
ここでは、同時に満たす必要がある 2 つのクエリ条件を指定します。必須パラメータを介して。
ページ分けクエリ- データ量が多い場合は、検索結果をページ分けできます:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'body' => [ 'from' => 0, 'size' => 10, 'query' => [ 'match' => [ 'title' => 'PHP' ] ] ]
];
$response = $client->search($params);
from パラメーターと size パラメーターを使用して、結果セットのオフセットとサイズを指定します。
スコアによる並べ替え- より正確な検索結果を得るために、Elasticsearch は各ドキュメントの関連性スコアを計算します。評価による並べ替えは、次のコードで行うことができます:
$params = [
'index' => 'my_index', 'type' => 'my_type', 'body' => [ 'query' => [ 'match' => [ 'title' => 'PHP' ] ], 'sort' => [ '_score' => [ 'order' => 'desc' ] ] ]
];
$response = $client->search($params);
このようにして、クエリ結果は関連性スコアに基づいて高いものから低いものへと並べ替えられます。
4. 分析
Elasticsearch は、データセットに関するより深い情報を取得するために使用できる、さまざまな強力な分析および集計関数をサポートしています。
集計- 次のコードは、「タイトル」フィールドで出現頻度が最も高い上位 10 個の単語を取得できます。
$params = [
'index' => 'my_index', 'type' => 'my_type', 'size' => 0, 'body' => [ 'aggs' => [ 'top_titles' => [ 'terms' => [ 'field' => 'title.keyword', 'size' => 10 ] ] ] ]
];
$response = $client->search($params);
サイズ パラメーターを指定して、ドキュメントを返すことをスキップし、集計された結果のみを返します。
アナライザー- Elasticsearch には、テキストを分析および処理するための強力なアナライザーも多数提供されています。次のコードは、中国語パーサーを使用してテキストを処理する方法を示しています。
$params = [
'index' => 'my_index', 'body' => [ 'settings' => [ 'analysis' => [ 'analyzer' => [ 'my_analyzer' => [ 'type' => 'custom', 'tokenizer' => 'ik_max_word' ] ] ] ] ]
];
$response = $client->indices() - >putSettings($params);
这里,我们为名为“my_analyzer”的分析器指定了“ik_max_word”分词器。
下面的代码可以使用这个分析器来分析文本:
$params = [
'index' => 'my_index', 'body' => [ 'query' => [ 'query_string' => [ 'query' => '搜索', 'analyzer' => 'my_analyzer', 'default_field' => 'title' ] ] ]
];
$response = $client->search($params);
这样,我们就可以使用中文分析器来分析中文文本了。
总结
在本文中,我向您介绍了如何使用elasticsearch-php的API来创建、添加、更新和删除索引和文档,以及如何使用搜索API来执行简单和复杂的查询。此外,我还介绍了使用聚合和分析器来处理数据的相关技术。
随着数据集规模的增加,Elasticsearch的重要性逐渐增加。只要您熟悉它的API,您就可以通过PHP轻松地利用其强大的搜索和分析能力来优化您的Web应用程序。
以上がPHP 開発: Elasticsearch を使用して全文検索を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

あなたが経験豊富な PHP 開発者であれば、すでにそこにいて、すでにそれを行っていると感じているかもしれません。あなたは、運用を達成するために、かなりの数のアプリケーションを開発し、数百万行のコードをデバッグし、大量のスクリプトを微調整してきました。

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

文字列は、文字、数字、シンボルを含む一連の文字です。このチュートリアルでは、さまざまな方法を使用してPHPの特定の文字列内の母音の数を計算する方法を学びます。英語の母音は、a、e、i、o、u、そしてそれらは大文字または小文字である可能性があります。 母音とは何ですか? 母音は、特定の発音を表すアルファベットのある文字です。大文字と小文字など、英語には5つの母音があります。 a、e、i、o、u 例1 入力:string = "tutorialspoint" 出力:6 説明する 文字列「TutorialSpoint」の母音は、u、o、i、a、o、iです。合計で6元があります

静的結合(静的::) PHPで後期静的結合(LSB)を実装し、クラスを定義するのではなく、静的コンテキストで呼び出しクラスを参照できるようにします。 1)解析プロセスは実行時に実行されます。2)継承関係のコールクラスを検索します。3)パフォーマンスオーバーヘッドをもたらす可能性があります。

PHPの魔法の方法は何ですか? PHPの魔法の方法には次のものが含まれます。1。\ _ \ _コンストラクト、オブジェクトの初期化に使用されます。 2。\ _ \ _リソースのクリーンアップに使用される破壊。 3。\ _ \ _呼び出し、存在しないメソッド呼び出しを処理します。 4。\ _ \ _ get、dynamic属性アクセスを実装します。 5。\ _ \ _セット、動的属性設定を実装します。これらの方法は、特定の状況で自動的に呼び出され、コードの柔軟性と効率を向上させます。
