首頁 後端開發 php教程 PHP開發:如何使用 Elasticsearch 實現全文檢索

PHP開發:如何使用 Elasticsearch 實現全文檢索

Jun 14, 2023 pm 05:07 PM
php elasticsearch 全文檢索

在現代網路應用程式中,資料量越來越大,但使用者期望和對資料的存取也越來越廣泛。因此,搜尋技術變得越來越重要,能夠滿足用戶的預期並提供更好的用戶體驗。全文搜尋是一種強大的技術,能夠快速索引、搜尋和排序大量資料。在這方面,Elasticsearch是一個領先的開源搜尋引擎,它提供了許多先進的特性以及高可用性、易擴展性等優勢。

在本篇文章中,將介紹如何透過PHP使用Elasticsearch實現全文檢索。我們將從環境設定開始,包括Elasticsearch和PHP的安裝,然後從索引、搜尋和分析三個主要方面進行深入的介紹。

一、環境設定

首先,在本機或伺服器上安裝Elasticsearch。 Elasticsearch可以從官方網站或透過套件管理器進行下載安裝。

其次,透過Composer安裝Elasticsearch的PHP客戶端,也就是elasticsearch-php,它提供了許多方便的方法和類別來呼叫Elasticsearch API。

composer require elasticsearch/elasticsearch

安裝完成後,在PHP檔案中進行以下設定:

require 'vendor/autoload.php';

$client = ElasticsearchClientBuilder::create()->build();

#這樣,就建立了一個與Elasticsearch伺服器通訊的客戶端。

二、索引

在Elasticsearch中,索引是一個用於儲存和快速查找資料的資料集合。我們可以使用elasticsearch-php的API將資料插入到索引中。

  1. 建立一個索引

首先,我們需要建立一個新索引。我們透過以下程式碼,在名為「my_index」的索引中建立一個名為「my_type」的類型。

$params = [

'index' => 'my_index',
'body'  => [
    'mappings' => [
        'my_type' => [
            'properties' => [
                'title' => ['type' => 'text'],
                'body'  => ['type' => 'text'],
            ]
        ]
    ]
]
登入後複製

];

$response = $client->indices()->create($params);

“properties”數組中的“title”和“body”欄位類型為“text”,這意味著它們會進行全文索引。在實務中,我們會根據具體的需求來設定索引和欄位類型。

這樣,我們就成功建立了一個名為「my_index」的索引。

  1. 在索引中新增文件資料

使用下列程式碼將文件插入索引:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'title' => 'PHP Elasticsearch 全文检索',
    'body'  => 'Elasticsearch 是一个领先的全文搜索引擎,其功能包括分布式、高可用、实时搜索和分析能力等。',
]
登入後複製

];

$response = $client->index($params);

這裡,我們將一篇帶有標題和正文的文檔插入索引中。

  1. 更新文檔

如果需要更新索引中已有的文檔,請使用下列程式碼:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1',
'body'  => [
    'doc' => [
        'title' => '修改后的标题',
        'body'  => '修改后的正文内容',
    ]
]
登入後複製

];

$response = $client->update($params);

需要注意的是,在更新時必須提供文件的ID。

  1. 刪除文檔

如果需要刪除已經存在的文檔,請使用以下程式碼:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1'
登入後複製

] ;

$response = $client->delete($params);

這樣,我們就完成了索引和文件的建立、插入、更新和刪除。

三、搜尋

我們來看看如何使用elasticsearch-php的API來進行搜尋。

  1. 簡單查詢

首先,讓我們執行一個簡單的查詢:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]
登入後複製

];

$response = $client->search($params);

在上面的程式碼中,我們執行了一個符合查詢,查詢索引中所有包含「PHP」關鍵字的文檔。搜尋結果將儲存在$response變數中。

  1. 多條件查詢

如果需要查詢多個條件,則可以使用bool查詢來組合多個條件:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'bool' => [
            'must' => [
                [ 'match' => [ 'title' => 'PHP' ] ],
                [ 'match' => [ 'body'  => '搜索引擎' ] ]
            ]
        ]
    ]
]
登入後複製

];

$response = $client->search($params);

這裡,我們透過must參數指定了兩個必須同時滿足的查詢條件。

  1. 分頁查詢

如果資料量很大,我們可以將搜尋結果分頁:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'from' => 0, 'size' => 10,
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]
登入後複製

];

$response = $client->search($params);

透過from和size參數指定結果集的偏移量和大小。

  1. 依評分排序

為了獲得更準確的搜尋結果,Elasticsearch會為每個文件計算一個相關性評分。可以透過以下程式碼按評分進行排序:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ],
    'sort'  => [
        '_score' => [ 'order' => 'desc' ]
    ]
]
登入後複製

];

$response = $client->search($params);

這樣查詢結果將會依照相關性分數從高到低排序。

四、分析

Elasticsearch支援各種強大的分析和聚合功能,我們可以使用它們來獲取有關資料集的更深入資訊。

  1. 聚合

以下程式碼可以取得「title」欄位出現頻率最高的前10個字:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'size'  => 0,
'body'  => [
    'aggs' => [
        'top_titles' => [
            'terms' => [
                'field' => 'title.keyword',
                'size'  => 10
            ]
        ]
    ]
]
登入後複製

];

$response = $client->search($params);

透過size參數指定跳過返回文檔,並且只傳回聚合結果。

  1. 分析器

Elasticsearch也提供了許多強大的分析器來對文字進行分析和處理。以下程式碼示範如何使用中文分析器來處理文字:

$params = [

'index' => 'my_index',
'body'  => [
    'settings' => [
        'analysis' => [
            'analyzer' => [
                'my_analyzer'   => [
                    'type'      => 'custom',
                    'tokenizer' => 'ik_max_word'
                ]
            ]
        ]
    ]
]
登入後複製

];

$response = $client->indices()- >putSettings($params);

这里,我们为名为“my_analyzer”的分析器指定了“ik_max_word”分词器。

下面的代码可以使用这个分析器来分析文本:

$params = [

'index' => 'my_index',
'body'  => [
    'query' => [
        'query_string' => [
            'query'         => '搜索',
            'analyzer'      => 'my_analyzer',
            'default_field' => 'title'
        ]
    ]
]
登入後複製

];

$response = $client->search($params);

这样,我们就可以使用中文分析器来分析中文文本了。

总结

在本文中,我向您介绍了如何使用elasticsearch-php的API来创建、添加、更新和删除索引和文档,以及如何使用搜索API来执行简单和复杂的查询。此外,我还介绍了使用聚合和分析器来处理数据的相关技术。

随着数据集规模的增加,Elasticsearch的重要性逐渐增加。只要您熟悉它的API,您就可以通过PHP轻松地利用其强大的搜索和分析能力来优化您的Web应用程序。

以上是PHP開發:如何使用 Elasticsearch 實現全文檢索的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1317
25
PHP教程
1268
29
C# 教程
1248
24
在PHP API中說明JSON Web令牌(JWT)及其用例。 在PHP API中說明JSON Web令牌(JWT)及其用例。 Apr 05, 2025 am 12:04 AM

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

php程序在字符串中計數元音 php程序在字符串中計數元音 Feb 07, 2025 pm 12:12 PM

字符串是由字符組成的序列,包括字母、數字和符號。本教程將學習如何使用不同的方法在PHP中計算給定字符串中元音的數量。英語中的元音是a、e、i、o、u,它們可以是大寫或小寫。 什麼是元音? 元音是代表特定語音的字母字符。英語中共有五個元音,包括大寫和小寫: a, e, i, o, u 示例 1 輸入:字符串 = "Tutorialspoint" 輸出:6 解釋 字符串 "Tutorialspoint" 中的元音是 u、o、i、a、o、i。總共有 6 個元

解釋PHP中的晚期靜態綁定(靜態::)。 解釋PHP中的晚期靜態綁定(靜態::)。 Apr 03, 2025 am 12:04 AM

靜態綁定(static::)在PHP中實現晚期靜態綁定(LSB),允許在靜態上下文中引用調用類而非定義類。 1)解析過程在運行時進行,2)在繼承關係中向上查找調用類,3)可能帶來性能開銷。

什麼是PHP魔術方法(__ -construct,__destruct,__call,__get,__ set等)並提供用例? 什麼是PHP魔術方法(__ -construct,__destruct,__call,__get,__ set等)並提供用例? Apr 03, 2025 am 12:03 AM

PHP的魔法方法有哪些? PHP的魔法方法包括:1.\_\_construct,用於初始化對象;2.\_\_destruct,用於清理資源;3.\_\_call,處理不存在的方法調用;4.\_\_get,實現動態屬性訪問;5.\_\_set,實現動態屬性設置。這些方法在特定情況下自動調用,提升代碼的靈活性和效率。

PHP和Python:比較兩種流行的編程語言 PHP和Python:比較兩種流行的編程語言 Apr 14, 2025 am 12:13 AM

PHP和Python各有優勢,選擇依據項目需求。 1.PHP適合web開發,尤其快速開發和維護網站。 2.Python適用於數據科學、機器學習和人工智能,語法簡潔,適合初學者。

PHP行動:現實世界中的示例和應用程序 PHP行動:現實世界中的示例和應用程序 Apr 14, 2025 am 12:19 AM

PHP在電子商務、內容管理系統和API開發中廣泛應用。 1)電子商務:用於購物車功能和支付處理。 2)內容管理系統:用於動態內容生成和用戶管理。 3)API開發:用於RESTfulAPI開發和API安全性。通過性能優化和最佳實踐,PHP應用的效率和可維護性得以提升。

PHP:網絡開發的關鍵語言 PHP:網絡開發的關鍵語言 Apr 13, 2025 am 12:08 AM

PHP是一種廣泛應用於服務器端的腳本語言,特別適合web開發。 1.PHP可以嵌入HTML,處理HTTP請求和響應,支持多種數據庫。 2.PHP用於生成動態網頁內容,處理表單數據,訪問數據庫等,具有強大的社區支持和開源資源。 3.PHP是解釋型語言,執行過程包括詞法分析、語法分析、編譯和執行。 4.PHP可以與MySQL結合用於用戶註冊系統等高級應用。 5.調試PHP時,可使用error_reporting()和var_dump()等函數。 6.優化PHP代碼可通過緩存機制、優化數據庫查詢和使用內置函數。 7

PHP的持久相關性:它還活著嗎? PHP的持久相關性:它還活著嗎? Apr 14, 2025 am 12:12 AM

PHP仍然具有活力,其在現代編程領域中依然佔據重要地位。 1)PHP的簡單易學和強大社區支持使其在Web開發中廣泛應用;2)其靈活性和穩定性使其在處理Web表單、數據庫操作和文件處理等方面表現出色;3)PHP不斷進化和優化,適用於初學者和經驗豐富的開發者。

See all articles