基于redis乐观锁怎么实现并发排队-Redis-PHP中文网

概况

流程设计

代码实现

首页

数据库

Redis

基于redis乐观锁怎么实现并发排队

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 04, 2023 am 09:58 AM

redis

有个需求场景是这样的，使用redis控制scrapy运行的数量。设置系统后台为4后，scrapy最多只能启动4个任务，多余的任务将被排队等待。

概况

最近做了一个django + scrapy + celery + redis 的爬虫系统，客户购买的主机除了跑其他程序外，还要跑我开发的这套程序，所以需要手动控制scrapy的实例数量，避免过多的爬虫给系统造成负担。

流程设计

1、爬虫任务由用户以请求的方式发起，所有的用户的请求统一进入到celery进行排队；
2、任务数量控制的执行就交给reids，经由celery保存到redis，包含了爬虫启动所需要的必要信息，从redis取一条信息即可启动一个爬虫；
3、通过scrapyd的接口来获取当前在运行的爬虫数量，以便决定下一步流程：如果小于4，则从redis中取相应数量的信息来启动爬虫，如果大于等于4，则继续等待；
4、如果在运行爬虫的数量有所减少，则及时从reids中取相应数量的信息来启动爬虫。

代码实现

业务代码有点复杂和啰嗦，此处使用伪代码来演示

import redis

# 实例化一个redis连接池
pool = redis.ConnectionPool(host=&#39;127.0.0.1&#39;, port=6379, decode_responses=True, db=4, password=&#39;&#39;)

r = redis.Redis(connection_pool=pool)
# 爬虫实例限制为4 即只允许4个scrapy实例在运行
limited = 4

# 声明redis的乐观锁
lock = r.Lock()

# lock.acquire中有while循环，即它会线程阻塞，直到当前线程获得redis的lock，才会继续往下执行代码
if lock.acquire():
	# 1、从reids中取一条爬虫信息
	info = redis.get() 
	
	# 2、while循环监听爬虫运行的数量
	while True:
		req = requests.get(&#39;http://127.0.0.1:6800/daemonstatus.json&#39;).json()
		# 统计当前有多少个爬虫在运行
		running = req.get(&#39;running&#39;) + req.get(&#39;pending&#39;)
		
		# 3、判断是否等待还是要增加爬虫数量
		# 3.1 如果在运行的数量大于等于设置到量 则继续等待
		if running >= limited:
			continue
		
		# 3.2 如果小于 则启动爬虫
		start_scrapy(info)
		# 3.3 将info从redis中删除
		redis.delete(info)
		# 3.4 释放锁
		lock.release()
		break

登录后复制

当前，这只是伪代码而已，实际的业务逻辑可能是非常复杂的，如：

@shared_task
def scrapy_control(key_uuid):

    r = redis.Redis(connection_pool=pool)
    db = MysqlDB()
    speed_limited = db.fetch_config(&#39;REPTILE_SPEED&#39;)
    speed_limited = int(speed_limited[0])

    keywords_num = MysqlDB().fetch_config(&#39;SEARCH_RANDOM&#39;)
    keywords_num = int(keywords_num[0])


    # while True:
    lock = r.lock(&#39;lock&#39;)
    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 进入处理环节&#39; +  &#39;\n&#39;)
    try:
        # acquire默认阻塞 如果获取不到锁时 会一直阻塞在这个函数的while循环中
        if lock.acquire():
            with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 获得锁&#39; +  &#39;\n&#39;)
            # 1 从redis中获取信息
            redis_obj = json.loads(r.get(key_uuid))
            user_id = redis_obj.get(&#39;user_id&#39;)
            contents = redis_obj.get(&#39;contents&#39;)
            
            # 2 使用while循环处理核心逻辑          
            is_hold_print = True
            while True:
                req = requests.get(&#39;http://127.0.0.1:6800/daemonstatus.json&#39;).json()
                running = req.get(&#39;running&#39;) + req.get(&#39;pending&#39;)
                # 3 如果仍然有足够的爬虫在运行 则hold住redis锁，等待有空余的爬虫位置让出
                if running >= speed_limited:
                    if is_hold_print:
                        with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 爬虫在运行，线程等待中&#39; +  &#39;\n&#39;)
                        is_hold_print = False
                    time.sleep(1)
                    continue
                
                # 4 有空余的爬虫位置 则往下走
                # 4.1 处理完所有的内容后 释放锁
                if len(contents) == 0:
                    r.delete(key_uuid)
                    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 任务已完成，从redis中删除&#39; +  &#39;\n&#39;)
                    lock.release()
                    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 释放锁&#39; +  &#39;\n&#39;)
                    break

                # 4.2 创建task任务
                task_uuid = str(uuid.uuid4())
                article_obj = contents.pop()
                article_id = article_obj.get(&#39;article_id&#39;)
                article = article_obj.get(&#39;content&#39;)
                try:
                    Task.objects.create(
                        task_uuid = task_uuid,
                        user_id = user_id,
                        article_id = article_id,
                        content = article
                    )
                except Exception as e:
                    with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39;->&#39; + str(task_uuid) + &#39; 创建Task出错: &#39; + str(e) +  &#39;\n&#39;)
                # finally:
                # 4.3 启动爬虫任务 即便创建task失败也会启动
                try:
                    task_chain(user_id, article, task_uuid, keywords_num)
                except Exception as e:
                    with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 启动任务链失败: &#39; + str(e) +  &#39;\n&#39;)
                
                # 加入sleep 防止代码执行速度快于爬虫启动速度而导致当前线程启动额外的爬虫
                time.sleep(5)

    except Exception as e:
        with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 获得锁之后的操作出错: &#39; + str(e) +  &#39;\n&#39;)
        lock.release()

登录后复制

小坑
scrapy启动速度相对较慢，所以while循环中，代码中执行到了爬虫的启动，需要sleep一下再去通过scrapyd接口获取爬虫运行的数量，如果立刻读取，可能会造成误判。

以上是基于redis乐观锁怎么实现并发排队的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

Java教程

1663

CakePHP 教程

1419

Laravel 教程

1313

PHP教程

1264

C# 教程

1237

显示更多

Related knowledge

redis集群模式怎么搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通过分片将Redis实例部署到多个服务器，提高可扩展性和可用性。搭建步骤如下：创建奇数个Redis实例，端口不同；创建3个sentinel实例，监控Redis实例并进行故障转移；配置sentinel配置文件，添加监控Redis实例信息和故障转移设置；配置Redis实例配置文件，启用集群模式并指定集群信息文件路径；创建nodes.conf文件，包含各Redis实例的信息；启动集群，执行create命令创建集群并指定副本数量；登录集群执行CLUSTER INFO命令验证集群状态；使

redis数据怎么清空 Apr 10, 2025 pm 10:06 PM

如何清空 Redis 数据：使用 FLUSHALL 命令清除所有键值。使用 FLUSHDB 命令清除当前选定数据库的键值。使用 SELECT 切换数据库，再使用 FLUSHDB 清除多个数据库。使用 DEL 命令删除特定键。使用 redis-cli 工具清空数据。

redis怎么读取队列 Apr 10, 2025 pm 10:12 PM

要从 Redis 读取队列，需要获取队列名称、使用 LPOP 命令读取元素，并处理空队列。具体步骤如下：获取队列名称：以 "queue:" 前缀命名，如 "queue:my-queue"。使用 LPOP 命令：从队列头部弹出元素并返回其值，如 LPOP queue:my-queue。处理空队列：如果队列为空，LPOP 返回 nil，可先检查队列是否存在再读取元素。

centos redis如何配置Lua脚本执行时间 Apr 14, 2025 pm 02:12 PM

在CentOS系统上，您可以通过修改Redis配置文件或使用Redis命令来限制Lua脚本的执行时间，从而防止恶意脚本占用过多资源。方法一：修改Redis配置文件定位Redis配置文件:Redis配置文件通常位于/etc/redis/redis.conf。编辑配置文件:使用文本编辑器（例如vi或nano）打开配置文件：sudovi/etc/redis/redis.conf设置Lua脚本执行时间限制:在配置文件中添加或修改以下行，设置Lua脚本的最大执行时间（单位：毫秒）

redis命令行怎么用 Apr 10, 2025 pm 10:18 PM

使用 Redis 命令行工具 (redis-cli) 可通过以下步骤管理和操作 Redis：连接到服务器，指定地址和端口。使用命令名称和参数向服务器发送命令。使用 HELP 命令查看特定命令的帮助信息。使用 QUIT 命令退出命令行工具。

redis计数器怎么实现 Apr 10, 2025 pm 10:21 PM

Redis计数器是一种使用Redis键值对存储来实现计数操作的机制，包含以下步骤：创建计数器键、增加计数、减少计数、重置计数和获取计数。Redis计数器的优势包括速度快、高并发、持久性和简单易用。它可用于用户访问计数、实时指标跟踪、游戏分数和排名以及订单处理计数等场景。

redis过期策略怎么设置 Apr 10, 2025 pm 10:03 PM

Redis数据过期策略有两种：定期删除：定期扫描删除过期键，可通过 expired-time-cap-remove-count、expired-time-cap-remove-delay 参数设置。惰性删除：仅在读取或写入键时检查删除过期键，可通过 lazyfree-lazy-eviction、lazyfree-lazy-expire、lazyfree-lazy-user-del 参数设置。

如何优化debian readdir的性能 Apr 13, 2025 am 08:48 AM

在Debian系统中，readdir系统调用用于读取目录内容。如果其性能表现不佳，可尝试以下优化策略：精简目录文件数量:尽可能将大型目录拆分成多个小型目录，降低每次readdir调用处理的项目数量。启用目录内容缓存:构建缓存机制，定期或在目录内容变更时更新缓存，减少对readdir的频繁调用。内存缓存（如Memcached或Redis）或本地缓存（如文件或数据库）均可考虑。采用高效数据结构:如果自行实现目录遍历，选择更高效的数据结构（例如哈希表而非线性搜索）存储和访问目录信

See all articles

基于redis乐观锁怎么实现并发排队

概况

流程设计

代码实现

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题