시계열 데이터 검색 및 집계를 실현하기 위한 RiSearch PHP 기술 아이디어
소개:
인터넷의 발달과 함께 많은 응용 시스템은 센서 데이터, 로그 데이터, 주식과 같은 대량의 시계열 데이터를 생성합니다. 가격 등 이 데이터에 대한 중요한 요구 사항은 빠르고 정확하게 검색하고 집계할 수 있어야 한다는 것입니다. RiSearch는 Redis를 기반으로 하는 전체 텍스트 검색 엔진입니다. 이 기사에서는 RiSearch와 PHP를 사용하여 시계열 데이터의 검색 및 집계 기능을 구현하는 방법을 설명합니다.
1. RiSearch 설치 및 구성
먼저 Redis와 RiSearch를 설치하고 PHP에 Redis 확장을 설치해야 합니다. 아래 단계에 따라 수행할 수 있습니다.
pecl install redis
명령을 실행하여 redis 확장을 설치하고 PHP 확장 목록에 추가합니다. pecl install redis
命令来安装redis扩展,并将其添加到PHP的扩展列表中。二、创建时间序列索引
使用RiSearch进行搜索和聚合之前,我们需要先创建时间序列索引。假设我们有一个日志系统,每条日志都包含时间戳和内容信息。我们可以通过以下代码来创建时间序列索引:
<?php $redis = new Redis(); $redis->connect('127.0.0.1', 6379); $redis->rawCommand('FT.CREATE', 'logs', 'SCHEMA', 'timestamp', 'NUMERIC', 'content', 'TEXT'); // 将日志数据添加到索引中 $logs = array( array('timestamp' => 1615516800, 'content' => '这是第一条日志'), array('timestamp' => 1615603200, 'content' => '这是第二条日志'), // ... ); foreach ($logs as $log) { $redis->rawCommand('FT.ADD', 'logs', 'doc:'.$log['timestamp'], 1.0, 'FIELDS', 'timestamp', $log['timestamp'], 'content', $log['content']); } ?>
在上面的代码中,我们首先创建了一个名为“logs”的时间序列索引,创建时定义了两个字段,分别是“timestamp”(时间戳)和“content”(内容)。然后,我们将每条日志数据按照时间顺序添加到了索引中。
三、搜索时间序列数据
使用RiSearch进行时间序列的搜索可以非常灵活和高效。以下是一个示例代码,用来根据时间范围搜索日志数据:
<?php $redis = new Redis(); $redis->connect('127.0.0.1', 6379); $query = '@timestamp:[1615516800 1615603200]'; // 搜索2021-03-12到2021-03-13之间的日志 $result = $redis->rawCommand('FT.SEARCH', 'logs', $query, 'LIMIT', 0, 10); // 输出搜索结果 foreach ($result as $key => $value) { if ($key % 2 === 0) { echo '日志ID:'.$value." "; } else { echo '内容:'.$value." "; } } ?>
在上面的代码中,我们使用了FT.SEARCH
命令进行搜索,指定了要搜索的索引名称“logs”和查询语句“@timestamp:[1615516800 1615603200]”,表示搜索2021-03-12到2021-03-13之间的日志。通过限制结果的数量和遍历输出,我们可以得到搜索结果。
四、聚合时间序列数据
在实际应用中,我们经常需要对时间序列数据进行聚合,比如计算某个时间段内的平均值、最大值、最小值等。RiSearch也提供了相应的聚合功能,以下是一个示例代码,用来计算特定时间范围内日志内容的出现频率:
<?php $redis = new Redis(); $redis->connect('127.0.0.1', 6379); $query = '@timestamp:[1615516800 1615603200]'; // 搜索2021-03-12到2021-03-13之间的日志 $result = $redis->rawCommand('FT.AGGREGATE', 'logs', $query, 'LOAD', 1, 'GROUPBY', 1, '@content', 'REDUCE', 'COUNT', 0, 'AS', 'count'); // 输出聚合结果 foreach ($result as $item) { echo '内容:'.$item['@content'].',出现频率:'.$item['count']." "; } ?>
在上面的代码中,我们使用了FT.AGGREGATE
RiSearch를 검색 및 집계에 사용하기 전에 먼저 시계열 인덱스를 생성해야 합니다. 로깅 시스템이 있고 각 로그에 타임스탬프와 콘텐츠 정보가 포함되어 있다고 가정해 보겠습니다. 다음 코드를 통해 시계열 인덱스를 생성할 수 있습니다.
rrreee
FT.SEARCH
명령을 사용하여 검색했습니다. " 및 쿼리문 "@timestamp:[1615516800 1615603200]"은 2021-03-12에서 2021-03-13 사이의 로그를 검색한다는 의미입니다. 결과 수를 제한하고 출력을 반복함으로써 검색 결과를 얻을 수 있습니다. 🎜🎜4. 시계열 데이터 집계🎜🎜실제 응용에서는 특정 기간 내의 평균, 최대값, 최소값 등을 계산하는 등 시계열 데이터를 집계해야 하는 경우가 많습니다. RiSearch는 해당 집계 기능도 제공합니다. 다음은 특정 시간 범위 내에서 로그 내용의 빈도를 계산하는 샘플 코드입니다. 🎜rrreee🎜위 코드에서는 FT.AGGREGATE
를 사용합니다. 이 명령은 집계를 수행합니다. 그리고 집계할 인덱스 이름 "logs"와 쿼리문 "@timestamp:[1615516800 1615603200]", 각 로그 내용의 발생 빈도를 계산한다는 의미의 집계 방법 "COUNT"를 지정합니다. 결과를 반복함으로써 집계된 결과를 얻을 수 있습니다. 🎜🎜요약: 🎜RiSearch와 PHP의 결합을 통해 시계열 데이터의 검색 및 집계 기능을 쉽게 구현할 수 있습니다. 시계열 인덱스를 생성하고 검색을 위해 FT.SEARCH를 사용하고 집계를 위해 FT.AGGREGATE를 사용함으로써 대량의 시계열 데이터를 빠르고 정확하게 처리하여 실제 애플리케이션의 요구 사항을 충족할 수 있습니다. 이 문서에서는 기본 아이디어와 코드 예제만 제공하므로 실제 사용에는 특정 요구 사항에 따라 해당 조정 및 최적화가 필요합니다. 🎜위 내용은 RiSearch PHP를 사용하여 시계열 데이터 검색 및 집계를 구현하기 위한 기술 아이디어의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!