Redis分词索引法怎么用-Redis-PHP中文网

分词索引法

Scan搜索法

首页

数据库

Redis

Redis分词索引法怎么用

王林

May 26, 2023 pm 05:28 PM

redis

分词索引法

这种方式是我实践过后，结合上篇的前辈给的观点觉得唯一比较可行且符合redis特性的方式，不过最终效率上还是比不过内存。

详细的实现思路清看Redis作者博客（参考资料1），这里的例子还是基于UserName，英文，并且只针对词组做了长度为3的分词，其他场景请自行扩展。

首先基于AutoComplete的字母搜索，那么我们需要对所有的Name做一个分词，即：

abc => (a, ab, abc)

当输入a时，我们会直接获取集合a中的内容；当输入ab时，我们会直接获取集合ab中的内容。那么我们开始转换，首先我们需要对User表的姓名进行分词：

var redis = ConnectionMultiplexer.Connect("localhost");var db = redis.GetDatabase();for (var i = 1; i < 4; i++)
{    var data = dbCon.Lookup<string, int>(string.Format(@"select words, id from (
                                    select Row_number() over (partition by words order by name) as rn,id,words from (
                                        select  id, SUBSTRING(name, 1, {0}) as words, name from User 
                                    ) as t
                                    ) t2 where rn <= {1} and words != &#39;&#39; and words is not null", i, 20));

    data.ForEach((key, item) =>  {
         db.SetAdd("capqueen:Cache:user:" + key.ToLower(), item.Select<int, RedisValue>(j => j).ToArray());
      });
}

登录后复制

第一步：采用SQL，分组排序筛选出每个分词的前20条数据，这里使用的是OrmLite的语法。

第二部：存入RedisSet，注意这里其实只是做了一个索引，并不保存具体的User内容

接着搜索的时候我们可以实现如下：

public List<User> SearchWords(string keywords)
{            var redis = ConnectionMultiplexer.Connect("localhost");            var db = redis.GetDatabase();            var result = db.SetMembers("capqueen:Cache:user:" + keywords.ToLower());            var users = new List<User>();            if (result.Any())
            {                //转换成ids                var ids = result.ToList().Select<RedisValue, RedisKey>(i => i.ToString());                //按照keys获取value ，事先已经存好了Usersvar values = db.StringGet(ids.ToArray());                //构造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }
}

登录后复制

经过实际的测试，这样的写法比前面的Keys确实好了不少，但是性能还是差强人意的。

Scan搜索法

这种方法是我在查阅了Redis的文档之后，发现的，但是也就是试验一下，估计也不能用做生产环境大规模查询。

根据数据结构的不同，Scan分为了SCAN、HSCAN、SSCAN和ZSCAN。更详细的信息请参阅文档。我们这里采用了ZSCAN：

ZSCAN key cursor [MATCH pattern] [COUNT count]

这里cursor是搜索的迭代的一个游标，具体还没弄明白，pattern就是匹配规则 count就是记录条数

由于我使用的是StackExchange.Redis，它提供的zscan方法是：

IEnumerable SortedSetScan(RedisKey key, RedisValue pattern = null, int pageSize = 10, long cursor = 0, int pageOffset = 0, CommandFlags flags = CommandFlags.None);

public void CreateTerminalCache(List<User> users)
{            if (users == null) return;            var db = ConnectionMultiplexer.GetDatabase();            var sourceData = new List<KeyValuePair<RedisKey, RedisValue>>();            //构造集合数据var list = users.Select(item =>{                var value = JsonConvert.SerializeObject(item);                //构造原始数据sourceData.Add(new KeyValuePair<RedisKey, RedisValue>("capqueen:users:" + item.Id, value));                //构造数据    return new SortedSetEntry(item.Name, item.Id);
            });            //添加进有序集合，采用name - id db.SortedSetAdd("capqueen:users:index", list.ToArray());            //添加港口数据key-value            db.StringSet(sourceData.ToArray(), When.Always, CommandFlags.None);
}

登录后复制

然后搜索的时候如下:

public List<User> GetUserByWord(string words)
{            var db = ConnectionMultiplexer.GetDatabase();            //搜索var result = db.SortedSetScan("capqueen:users:index", words + "*", 10, 1, 30, CommandFlags.None).Take(30).ToList();           var users = new List<User>();            if (result.Any())
            {                //转换成ids                var ids = result.ToList().Select<SortedSetEntry, RedisKey>(i => i.ToString());                //按照keys获取valuevar values = db.StringGet(ids.ToArray());                //构造List Json以加速解析var portsJson = new StringBuilder("[");

                values.ToList().ForEach(item =>{                    if (!string.IsNullOrWhiteSpace(item))
                    {
                        portsJson.Append(item).Append(",");
                    }
                });

                portsJson.Append("]");

                users = JsonConvert.DeserializeObject<List<User>>(portsJson.ToString());
            }            return users;
}

登录后复制

以上是Redis分词索引法怎么用的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7529

CakePHP 教程

1378

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

redis集群模式怎么搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通过分片将Redis实例部署到多个服务器，提高可扩展性和可用性。搭建步骤如下：创建奇数个Redis实例，端口不同；创建3个sentinel实例，监控Redis实例并进行故障转移；配置sentinel配置文件，添加监控Redis实例信息和故障转移设置；配置Redis实例配置文件，启用集群模式并指定集群信息文件路径；创建nodes.conf文件，包含各Redis实例的信息；启动集群，执行create命令创建集群并指定副本数量；登录集群执行CLUSTER INFO命令验证集群状态；使

redis指令怎么用 Apr 10, 2025 pm 08:45 PM

使用 Redis 指令需要以下步骤：打开 Redis 客户端。输入指令（动词键值）。提供所需参数（因指令而异）。按 Enter 执行指令。Redis 返回响应，指示操作结果（通常为 OK 或 -ERR）。

redis数据怎么清空 Apr 10, 2025 pm 10:06 PM

如何清空 Redis 数据：使用 FLUSHALL 命令清除所有键值。使用 FLUSHDB 命令清除当前选定数据库的键值。使用 SELECT 切换数据库，再使用 FLUSHDB 清除多个数据库。使用 DEL 命令删除特定键。使用 redis-cli 工具清空数据。

redis怎么使用单线程 Apr 10, 2025 pm 07:12 PM

Redis 使用单线程架构，以提供高性能、简单性和一致性。它利用 I/O 多路复用、事件循环、非阻塞 I/O 和共享内存来提高并发性，但同时存在并发性受限、单点故障和不适合写密集型工作负载的局限性。

redis怎么读源码 Apr 10, 2025 pm 08:27 PM

理解 Redis 源码的最佳方法是逐步进行：熟悉 Redis 基础知识。选择一个特定的模块或功能作为起点。从模块或功能的入口点开始，逐行查看代码。通过函数调用链查看代码。熟悉 Redis 使用的底层数据结构。识别 Redis 使用的算法。

redis怎么读取队列 Apr 10, 2025 pm 10:12 PM

要从 Redis 读取队列，需要获取队列名称、使用 LPOP 命令读取元素，并处理空队列。具体步骤如下：获取队列名称：以 "queue:" 前缀命名，如 "queue:my-queue"。使用 LPOP 命令：从队列头部弹出元素并返回其值，如 LPOP queue:my-queue。处理空队列：如果队列为空，LPOP 返回 nil，可先检查队列是否存在再读取元素。

redis怎么查看所有的key Apr 10, 2025 pm 07:15 PM

要查看 Redis 中的所有键，共有三种方法：使用 KEYS 命令返回所有匹配指定模式的键；使用 SCAN 命令迭代键并返回一组键；使用 INFO 命令获取键的总数。

redis底层怎么实现 Apr 10, 2025 pm 07:21 PM

Redis 使用哈希表存储数据，支持字符串、列表、哈希表、集合和有序集合等数据结构。Redis 通过快照 (RDB) 和追加只写 (AOF) 机制持久化数据。Redis 使用主从复制来提高数据可用性。Redis 使用单线程事件循环处理连接和命令，保证数据原子性和一致性。Redis 为键设置过期时间，并使用 lazy 删除机制删除过期键。

See all articles

Redis分词索引法怎么用

分词索引法

Scan搜索法

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题