首页 后端开发 php教程 PHP开发:如何使用 Elasticsearch 实现全文检索

PHP开发:如何使用 Elasticsearch 实现全文检索

Jun 14, 2023 pm 05:07 PM
php elasticsearch 全文检索

在现代Web应用程序中,数据量越来越大,但用户期望和对数据的访问也越来越广泛。因此,搜索技术变得越来越重要,能够满足用户的预期并提供更好的用户体验。全文搜索是一种强大的技术,能够快速索引、搜索和排序大量数据。在这方面,Elasticsearch是一个领先的开源搜索引擎,它提供了许多先进的特性以及高可用性、易扩展性等优势。

在本篇文章中,将介绍如何通过PHP使用Elasticsearch实现全文检索。我们将从环境设置开始,包括Elasticsearch和PHP的安装,然后从索引、搜索和分析三个主要方面进行深入的介绍。

一、环境设置

首先,在本地或服务器上安装Elasticsearch。Elasticsearch可以从官方网站或者通过包管理器进行下载安装。

其次,通过Composer安装Elasticsearch的PHP客户端,也就是elasticsearch-php,它提供了许多方便的方法和类来调用Elasticsearch API。

composer require elasticsearch/elasticsearch

安装完成后,在PHP文件中进行如下配置:

require 'vendor/autoload.php';

$client = ElasticsearchClientBuilder::create()->build();

这样,就创建了一个与Elasticsearch服务器通信的客户端。

二、索引

在Elasticsearch中,索引是一个用于存储和快速查找数据的数据集合。我们可以使用elasticsearch-php的API将数据插入到索引中。

  1. 创建一个索引

首先,我们需要创建一个新索引。我们通过以下代码,在名为“my_index”的索引中创建一个名为“my_type”的类型。

$params = [

'index' => 'my_index',
'body'  => [
    'mappings' => [
        'my_type' => [
            'properties' => [
                'title' => ['type' => 'text'],
                'body'  => ['type' => 'text'],
            ]
        ]
    ]
]
登录后复制

];

$response = $client->indices()->create($params);

“properties”数组中的“title”和“body”字段类型为“text”,这意味着它们会进行全文索引。在实践中,我们会根据具体的需求来设置索引和字段类型。

这样,我们就成功创建了一个名为“my_index”的索引。

  1. 向索引中添加文档数据

使用以下代码将文档插入到索引中:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'title' => 'PHP Elasticsearch 全文检索',
    'body'  => 'Elasticsearch 是一个领先的全文搜索引擎,其功能包括分布式、高可用、实时搜索和分析能力等。',
]
登录后复制

];

$response = $client->index($params);

这里,我们将一篇带有标题和正文的文档插入到索引中。

  1. 更新文档

如果需要更新索引中已有的文档,使用以下代码:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1',
'body'  => [
    'doc' => [
        'title' => '修改后的标题',
        'body'  => '修改后的正文内容',
    ]
]
登录后复制

];

$response = $client->update($params);

需要注意的是,在更新时必须提供文档的ID。

  1. 删除文档

如果需要删除已经存在的文档,使用以下代码:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'id'    => '1'
登录后复制

];

$response = $client->delete($params);

这样,我们就完成了索引和文档的创建、插入、更新和删除。

三、搜索

我们来看一下如何使用elasticsearch-php的API来进行搜索。

  1. 简单查询

首先,让我们执行一个简单的查询:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]
登录后复制

];

$response = $client->search($params);

在上面的代码中,我们执行了一个匹配查询,查询索引中所有包含“PHP”关键字的文档。搜索结果将存储在$response变量中。

  1. 多条件查询

如果需要查询多个条件,则可以使用bool查询来组合多个条件:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'bool' => [
            'must' => [
                [ 'match' => [ 'title' => 'PHP' ] ],
                [ 'match' => [ 'body'  => '搜索引擎' ] ]
            ]
        ]
    ]
]
登录后复制

];

$response = $client->search($params);

这里,我们通过must参数指定了必须同时满足的两个查询条件。

  1. 分页查询

如果数据量很大,我们可以将搜索结果分页:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'from' => 0, 'size' => 10,
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ]
]
登录后复制

];

$response = $client->search($params);

通过from和size参数指定结果集的偏移量和大小。

  1. 按评分排序

为了获得更准确的搜索结果,Elasticsearch会为每个文档计算一个相关性评分。可以通过以下代码按评分进行排序:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'body'  => [
    'query' => [
        'match' => [
            'title' => 'PHP'
        ]
    ],
    'sort'  => [
        '_score' => [ 'order' => 'desc' ]
    ]
]
登录后复制

];

$response = $client->search($params);

这样查询结果将按相关性评分从高到低进行排序。

四、分析

Elasticsearch支持各种强大的分析和聚合功能,我们可以使用它们获取有关数据集的更深入信息。

  1. 聚合

以下代码可以获取“title”字段出现频率最高的前10个词:

$params = [

'index' => 'my_index',
'type'  => 'my_type',
'size'  => 0,
'body'  => [
    'aggs' => [
        'top_titles' => [
            'terms' => [
                'field' => 'title.keyword',
                'size'  => 10
            ]
        ]
    ]
]
登录后复制

];

$response = $client->search($params);

通过size参数指定跳过返回文档,并且仅返回聚合结果。

  1. 分析器

Elasticsearch还提供了许多强大的分析器来对文本进行分析和处理。以下代码演示了如何使用中文分析器来处理文本:

$params = [

'index' => 'my_index',
'body'  => [
    'settings' => [
        'analysis' => [
            'analyzer' => [
                'my_analyzer'   => [
                    'type'      => 'custom',
                    'tokenizer' => 'ik_max_word'
                ]
            ]
        ]
    ]
]
登录后复制

];

$response = $client->indices()->putSettings($params);

这里,我们为名为“my_analyzer”的分析器指定了“ik_max_word”分词器。

下面的代码可以使用这个分析器来分析文本:

$params = [

'index' => 'my_index',
'body'  => [
    'query' => [
        'query_string' => [
            'query'         => '搜索',
            'analyzer'      => 'my_analyzer',
            'default_field' => 'title'
        ]
    ]
]
登录后复制

];

$response = $client->search($params);

这样,我们就可以使用中文分析器来分析中文文本了。

总结

在本文中,我向您介绍了如何使用elasticsearch-php的API来创建、添加、更新和删除索引和文档,以及如何使用搜索API来执行简单和复杂的查询。此外,我还介绍了使用聚合和分析器来处理数据的相关技术。

随着数据集规模的增加,Elasticsearch的重要性逐渐增加。只要您熟悉它的API,您就可以通过PHP轻松地利用其强大的搜索和分析能力来优化您的Web应用程序。

以上是PHP开发:如何使用 Elasticsearch 实现全文检索的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

适用于 Ubuntu 和 Debian 的 PHP 8.4 安装和升级指南 适用于 Ubuntu 和 Debian 的 PHP 8.4 安装和升级指南 Dec 24, 2024 pm 04:42 PM

PHP 8.4 带来了多项新功能、安全性改进和性能改进,同时弃用和删除了大量功能。 本指南介绍了如何在 Ubuntu、Debian 或其衍生版本上安装 PHP 8.4 或升级到 PHP 8.4

CakePHP 日期和时间 CakePHP 日期和时间 Sep 10, 2024 pm 05:27 PM

为了在 cakephp4 中处理日期和时间,我们将使用可用的 FrozenTime 类。

CakePHP 文件上传 CakePHP 文件上传 Sep 10, 2024 pm 05:27 PM

为了进行文件上传,我们将使用表单助手。这是文件上传的示例。

讨论 CakePHP 讨论 CakePHP Sep 10, 2024 pm 05:28 PM

CakePHP 是 PHP 的开源框架。它的目的是使应用程序的开发、部署和维护变得更加容易。 CakePHP 基于类似 MVC 的架构,功能强大且易于掌握。模型、视图和控制器 gu

CakePHP 创建验证器 CakePHP 创建验证器 Sep 10, 2024 pm 05:26 PM

可以通过在控制器中添加以下两行来创建验证器。

CakePHP 日志记录 CakePHP 日志记录 Sep 10, 2024 pm 05:26 PM

登录 CakePHP 是一项非常简单的任务。您只需使用一项功能即可。您可以记录任何后台进程(如 cronjob)的错误、异常、用户活动、用户采取的操作。在 CakePHP 中记录数据很容易。提供了 log() 函数

如何设置 Visual Studio Code (VS Code) 进行 PHP 开发 如何设置 Visual Studio Code (VS Code) 进行 PHP 开发 Dec 20, 2024 am 11:31 AM

Visual Studio Code,也称为 VS Code,是一个免费的源代码编辑器 - 或集成开发环境 (IDE) - 可用于所有主要操作系统。 VS Code 拥有针对多种编程语言的大量扩展,可以轻松编写

CakePHP 快速指南 CakePHP 快速指南 Sep 10, 2024 pm 05:27 PM

CakePHP 是一个开源MVC 框架。它使开发、部署和维护应用程序变得更加容易。 CakePHP 有许多库可以减少大多数常见任务的过载。

See all articles