基於redis樂觀鎖怎麼實現並發排隊-Redis-PHP中文網

概況

流程設計

程式碼實作

首頁

資料庫

Redis

基於redis樂觀鎖怎麼實現並發排隊

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 04, 2023 am 09:58 AM

redis

有個需求場景是這樣的，使用redis控制scrapy運行的數量。設定係統後台為4後，scrapy最多只能啟動4個任務，多餘的任務將被排隊等待。

概況

最近做了一個django scrapy celery redis 的爬蟲系統，客戶購買的主機除了跑其他程序外，還要跑我開發的這套程序，所以需要手動控制scrapy的實例數量，避免過多的爬蟲對系統造成負擔。

流程設計

1、爬蟲任務由使用者以請求的方式發起，所有的使用者的請求統一進入到celery進行排隊；
2、任務數量控制的執行就交給reids，經由celery保存到redis，包含了爬蟲啟動所需的必要信息，從redis取一條信息即可啟動一個爬蟲；
3、通過scrapyd的接口來獲取當前在運行的爬蟲數量，以便決定下一步流程：如果小於4，則從redis中取相應數量的信息來啟動爬蟲，如果大於等於4，則繼續等待；
4、如果在運行爬蟲的數量有所減少，則及時從reids中取相應數量的資訊來啟動爬蟲。

程式碼實作

業務程式碼有點複雜和囉嗦，這裡使用偽程式碼來示範

import redis

# 实例化一个redis连接池
pool = redis.ConnectionPool(host=&#39;127.0.0.1&#39;, port=6379, decode_responses=True, db=4, password=&#39;&#39;)

r = redis.Redis(connection_pool=pool)
# 爬虫实例限制为4 即只允许4个scrapy实例在运行
limited = 4

# 声明redis的乐观锁
lock = r.Lock()

# lock.acquire中有while循环，即它会线程阻塞，直到当前线程获得redis的lock，才会继续往下执行代码
if lock.acquire():
	# 1、从reids中取一条爬虫信息
	info = redis.get() 
	
	# 2、while循环监听爬虫运行的数量
	while True:
		req = requests.get(&#39;http://127.0.0.1:6800/daemonstatus.json&#39;).json()
		# 统计当前有多少个爬虫在运行
		running = req.get(&#39;running&#39;) + req.get(&#39;pending&#39;)
		
		# 3、判断是否等待还是要增加爬虫数量
		# 3.1 如果在运行的数量大于等于设置到量 则继续等待
		if running >= limited:
			continue
		
		# 3.2 如果小于 则启动爬虫
		start_scrapy(info)
		# 3.3 将info从redis中删除
		redis.delete(info)
		# 3.4 释放锁
		lock.release()
		break

登入後複製

目前，這只是偽程式碼而已，實際的業務邏輯可能是非常複雜的，如：

@shared_task
def scrapy_control(key_uuid):

    r = redis.Redis(connection_pool=pool)
    db = MysqlDB()
    speed_limited = db.fetch_config(&#39;REPTILE_SPEED&#39;)
    speed_limited = int(speed_limited[0])

    keywords_num = MysqlDB().fetch_config(&#39;SEARCH_RANDOM&#39;)
    keywords_num = int(keywords_num[0])


    # while True:
    lock = r.lock(&#39;lock&#39;)
    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 进入处理环节&#39; +  &#39;\n&#39;)
    try:
        # acquire默认阻塞 如果获取不到锁时 会一直阻塞在这个函数的while循环中
        if lock.acquire():
            with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 获得锁&#39; +  &#39;\n&#39;)
            # 1 从redis中获取信息
            redis_obj = json.loads(r.get(key_uuid))
            user_id = redis_obj.get(&#39;user_id&#39;)
            contents = redis_obj.get(&#39;contents&#39;)
            
            # 2 使用while循环处理核心逻辑          
            is_hold_print = True
            while True:
                req = requests.get(&#39;http://127.0.0.1:6800/daemonstatus.json&#39;).json()
                running = req.get(&#39;running&#39;) + req.get(&#39;pending&#39;)
                # 3 如果仍然有足够的爬虫在运行 则hold住redis锁，等待有空余的爬虫位置让出
                if running >= speed_limited:
                    if is_hold_print:
                        with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 爬虫在运行，线程等待中&#39; +  &#39;\n&#39;)
                        is_hold_print = False
                    time.sleep(1)
                    continue
                
                # 4 有空余的爬虫位置 则往下走
                # 4.1 处理完所有的内容后 释放锁
                if len(contents) == 0:
                    r.delete(key_uuid)
                    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 任务已完成，从redis中删除&#39; +  &#39;\n&#39;)
                    lock.release()
                    with open(&#39;log/celery/info.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 释放锁&#39; +  &#39;\n&#39;)
                    break

                # 4.2 创建task任务
                task_uuid = str(uuid.uuid4())
                article_obj = contents.pop()
                article_id = article_obj.get(&#39;article_id&#39;)
                article = article_obj.get(&#39;content&#39;)
                try:
                    Task.objects.create(
                        task_uuid = task_uuid,
                        user_id = user_id,
                        article_id = article_id,
                        content = article
                    )
                except Exception as e:
                    with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39;->&#39; + str(task_uuid) + &#39; 创建Task出错: &#39; + str(e) +  &#39;\n&#39;)
                # finally:
                # 4.3 启动爬虫任务 即便创建task失败也会启动
                try:
                    task_chain(user_id, article, task_uuid, keywords_num)
                except Exception as e:
                    with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 启动任务链失败: &#39; + str(e) +  &#39;\n&#39;)
                
                # 加入sleep 防止代码执行速度快于爬虫启动速度而导致当前线程启动额外的爬虫
                time.sleep(5)

    except Exception as e:
        with open(&#39;log/celery/error.log&#39;, &#39;a&#39;) as f: f.write(str(datetime.datetime.now()) + &#39;--&#39; + str(key_uuid) + &#39; 获得锁之后的操作出错: &#39; + str(e) +  &#39;\n&#39;)
        lock.release()

登入後複製

小坑
scrapy啟動速度相對較慢，所以while循環中，程式碼中執行到了爬蟲的啟動，需要sleep一下再去透過scrapyd介面取得爬蟲運行的數量，如果立刻讀取，可能會造成誤判。

以上是基於redis樂觀鎖怎麼實現並發排隊的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1666

CakePHP 教程

1425

Laravel 教程

1325

PHP教程

1273

C# 教程

1252

Related knowledge

redis集群模式怎麼搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通過分片將Redis實例部署到多個服務器，提高可擴展性和可用性。搭建步驟如下：創建奇數個Redis實例，端口不同；創建3個sentinel實例，監控Redis實例並進行故障轉移；配置sentinel配置文件，添加監控Redis實例信息和故障轉移設置；配置Redis實例配置文件，啟用集群模式並指定集群信息文件路徑；創建nodes.conf文件，包含各Redis實例的信息；啟動集群，執行create命令創建集群並指定副本數量；登錄集群執行CLUSTER INFO命令驗證集群狀態；使

redis數據怎麼清空 Apr 10, 2025 pm 10:06 PM

如何清空 Redis 數據：使用 FLUSHALL 命令清除所有鍵值。使用 FLUSHDB 命令清除當前選定數據庫的鍵值。使用 SELECT 切換數據庫，再使用 FLUSHDB 清除多個數據庫。使用 DEL 命令刪除特定鍵。使用 redis-cli 工具清空數據。

redis怎麼讀取隊列 Apr 10, 2025 pm 10:12 PM

要從 Redis 讀取隊列，需要獲取隊列名稱、使用 LPOP 命令讀取元素，並處理空隊列。具體步驟如下：獲取隊列名稱：以 "queue:" 前綴命名，如 "queue:my-queue"。使用 LPOP 命令：從隊列頭部彈出元素並返回其值，如 LPOP queue:my-queue。處理空隊列：如果隊列為空，LPOP 返回 nil，可先檢查隊列是否存在再讀取元素。

centos redis如何配置Lua腳本執行時間 Apr 14, 2025 pm 02:12 PM

在CentOS系統上，您可以通過修改Redis配置文件或使用Redis命令來限制Lua腳本的執行時間，從而防止惡意腳本佔用過多資源。方法一：修改Redis配置文件定位Redis配置文件:Redis配置文件通常位於/etc/redis/redis.conf。編輯配置文件:使用文本編輯器（例如vi或nano）打開配置文件：sudovi/etc/redis/redis.conf設置Lua腳本執行時間限制:在配置文件中添加或修改以下行，設置Lua腳本的最大執行時間（單位：毫秒）

redis命令行怎麼用 Apr 10, 2025 pm 10:18 PM

使用 Redis 命令行工具 (redis-cli) 可通過以下步驟管理和操作 Redis：連接到服務器，指定地址和端口。使用命令名稱和參數向服務器發送命令。使用 HELP 命令查看特定命令的幫助信息。使用 QUIT 命令退出命令行工具。

redis計數器怎麼實現 Apr 10, 2025 pm 10:21 PM

Redis計數器是一種使用Redis鍵值對存儲來實現計數操作的機制，包含以下步驟：創建計數器鍵、增加計數、減少計數、重置計數和獲取計數。 Redis計數器的優勢包括速度快、高並發、持久性和簡單易用。它可用於用戶訪問計數、實時指標跟踪、遊戲分數和排名以及訂單處理計數等場景。

redis過期策略怎麼設置 Apr 10, 2025 pm 10:03 PM

Redis數據過期策略有兩種：定期刪除：定期掃描刪除過期鍵，可通過 expired-time-cap-remove-count、expired-time-cap-remove-delay 參數設置。惰性刪除：僅在讀取或寫入鍵時檢查刪除過期鍵，可通過 lazyfree-lazy-eviction、lazyfree-lazy-expire、lazyfree-lazy-user-del 參數設置。

如何優化debian readdir的性能 Apr 13, 2025 am 08:48 AM

在Debian系統中，readdir系統調用用於讀取目錄內容。如果其性能表現不佳，可嘗試以下優化策略：精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄，降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制，定期或在目錄內容變更時更新緩存，減少對readdir的頻繁調用。內存緩存（如Memcached或Redis）或本地緩存（如文件或數據庫）均可考慮。採用高效數據結構:如果自行實現目錄遍歷，選擇更高效的數據結構（例如哈希表而非線性搜索）存儲和訪問目錄信

See all articles

基於redis樂觀鎖怎麼實現並發排隊

概況

流程設計

程式碼實作

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題