首頁 後端開發 php教程 非同步協程開髮指南:建構高效能的推薦系統

非同步協程開髮指南:建構高效能的推薦系統

Dec 17, 2023 pm 03:30 PM
協程 非同步 推薦系​​統

非同步協程開髮指南:建構高效能的推薦系統

隨著網路及行動互聯網的快速發展,資料量呈現爆炸性成長,如何高效處理資料成為了各大公司研發團隊面對的重要議題。推薦系​​統是其中一個關鍵的應用領域,在眾多企業中有著廣泛的應用。而異步協程是一個在高並發場景下實現高效能資料處理的重要技術,本文將介紹如何利用非同步協程建立高效能的推薦系統,並提供具體的程式碼範例。

一、什麼是非同步協程?

非同步協程是一種非常高效的並發程式設計模型,最初由 Python 語言提出並實現,後來經過多個語言的借鑒和發展,如 Go 語言中的 goroutine,Swift 中的 SwiftNIO 等。非同步協程透過在協程層級上切換,以支援高並發的非同步 I/O 操作。

與多執行緒相比,非同步協程具有以下優點:

  1. 更有效率:非同步協程可以實現非常輕量級的執行緒模型,切換開銷非常小。
  2. 更靈活:協程之間的切換不需要進入內核,而是由程式控制,因此可以更靈活地控制協程的數量和調度方式。
  3. 更容易用:比起多執行緒的鎖定機制,非同步協程透過協作式調度可以避免鎖等多執行緒問題,使得程式碼更簡潔易用。

二、推薦系統中的非同步協程應用場景

推薦系統在實現過程中需要處理大量的數據,例如使用者行為日誌、物品屬性資訊等,而異步協程則可以實現高效能的資料處理。具體地,推薦系統中有以下應用場景適合使用非同步協程:

  1. 使用者興趣特徵提取:透過非同步協程實現對使用者行為日誌的非同步讀取和處理,提取使用者興趣特徵,以支持個人化推薦。
  2. 物品資訊聚合:透過非同步協程實現對物品屬性資訊的非同步讀取和處理,將各種資訊聚合在一起,以支援物品的綜合推薦。
  3. 建議結果排序:透過非同步協程實現推薦結果的快速排序和過濾,以確保推薦系統的高吞吐量和低延遲。

三、非同步協程開髮指南

以下將分別從協程開發流程、調度機制和非同步 I/O 操作三個面向介紹非同步協程的開髮指南。

  1. 協程開發流程

在非同步協程中,需要使用協程函式庫來實現協程的建立、切換和調度等。目前比較受歡迎的協程庫有 Python 中的 asyncio,Go 中的 goroutine 和 Swift 中的 SwiftNIO 等。

以Python 中的asyncio 為例,實作一個簡單的非同步協程程式:

import asyncio

async def foo():
    await asyncio.sleep(1)
    print('Hello World!')

loop = asyncio.get_event_loop()
loop.run_until_complete(foo())
登入後複製

上述程式中,asyncio.sleep(1) 表示讓目前協程休眠1 秒鐘,以模擬非同步I/O 操作,async def 宣告的函數表示非同步函數。在程式中使用 loop.run_until_complete() 來執行協程,輸出結果為 Hello World!

  1. 調度機制

在非同步協程中,協程的調度是非常重要的一環。透過非同步協程的協作式調度,可以更靈活地控制協程的數量和調度順序,以達到最優的效能表現。

在asyncio 中,使用asyncio.gather() 方法來執行多個協程,例如:

import asyncio

async def foo():
    await asyncio.sleep(1)
    print('foo')

async def bar():
    await asyncio.sleep(2)
    print('bar')

loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.gather(foo(), bar()))
登入後複製

上述程式中,asyncio.gather( ) 可以同時執行多個協程,輸出結果為foobar。這裡的兩個協程的時間長度分別為 1 秒和 2 秒,因此輸出順序為 foobar

  1. 非同步 I/O 操作

在推薦系統中,需要使用非同步 I/O 操作來處理大量的使用者行為日誌、物品屬性資訊等資料。在非同步協程中使用非同步 I/O 操作可以大幅提高資料讀取和處理的效率。

在asyncio 中,使用asyncio.open() 方法來非同步讀取文件,例如:

import asyncio

async def read_file():
    async with aiofiles.open('data.log', 'r') as f:
        async for line in f:
            print(line.strip())

loop = asyncio.get_event_loop()
loop.run_until_complete(read_file())
登入後複製

上述程式中,使用async with aiofiles. open() 來非同步開啟文件,使用async for line in f 來非同步讀取檔案中的每行資料。在程式中使用 loop.run_until_complete() 來執行協程。

四、具體程式碼範例

以下具體介紹推薦系統中非同步協程的實作方法。

  1. 使用者興趣特徵提取

在推薦系統中,使用者興趣特徵提取是一個非常關鍵的環節。使用者行為日誌是推薦系統中的重要資料之一,因此需要使用非同步 I/O 來進行行為日誌的讀取和處理,以提取使用者興趣特徵。

import asyncio
import json

async def extract_feature(data):
    result = {}
    for item in data:
        uid = item.get('uid')
        if uid not in result:
            result[uid] = {'click': 0, 'expose': 0}
        if item.get('type') == 'click':
            result[uid]['click'] += 1
        elif item.get('type') == 'expose':
            result[uid]['expose'] += 1
    return result

async def read_file():
    async with aiofiles.open('data.log', 'r') as f:
        data = []
        async for line in f:
            data.append(json.loads(line))
            if len(data) >= 1000:
                result = await extract_feature(data)
                print(result)
                data = []

        if len(data) > 0:
            result = await extract_feature(data)
            print(result)

loop = asyncio.get_event_loop()
loop.run_until_complete(read_file())
登入後複製

上述程序中,extract_feature() 函数用于从用户行为日志中提取用户兴趣特征,read_file() 函数读取用户行为日志,并调用 extract_feature() 函数进行用户特征提取。在程序中,使用 if len(data) >= 1000 判断每次读取到的数据是否满足处理的条件。

  1. 物品信息聚合

在推荐系统中,物品信息的聚合是支持物品的综合推荐的必要环节。物品属性信息是推荐系统中的重要数据之一,因此需要使用异步 I/O 来进行读取和处理。

import asyncio
import json

async def aggregate_info(data):
    result = {}
    for item in data:
        key = item.get('key')
        if key not in result:
            result[key] = []
        result[key].append(item.get('value'))
    return result

async def read_file():
    async with aiofiles.open('data.log', 'r') as f:
        data = []
        async for line in f:
            data.append(json.loads(line))
            if len(data) >= 1000:
                result = await aggregate_info(data)
                print(result)
                data = []

        if len(data) > 0:
            result = await aggregate_info(data)
            print(result)

loop = asyncio.get_event_loop()
loop.run_until_complete(read_file())
登入後複製

上述程序中,aggregate_info() 函数用于从物品属性信息中聚合物品信息,read_file() 函数读取物品属性信息,并调用 aggregate_info() 函数进行信息聚合。在程序中,使用 if len(data) >= 1000 判断每次读取到的数据是否满足处理的条件。

  1. 推荐结果排序

在推荐系统中,推荐结果的排序是支持高吞吐量和低延迟的关键环节。通过异步协程进行推荐结果的排序和过滤,可以大大提高推荐系统的性能表现。

import asyncio

async def sort_and_filter(data):
    data.sort(reverse=True)
    result = []
    for item in data:
        if item[1] > 0:
            result.append(item)
    return result[:10]

async def recommend():
    data = [(1, 2), (3, 4), (2, 5), (7, 0), (5, -1), (6, 3), (9, 8)]
    result = await sort_and_filter(data)
    print(result)

loop = asyncio.get_event_loop()
loop.run_until_complete(recommend())
登入後複製

上述程序中,sort_and_filter() 函数用于对推荐结果进行排序和过滤,并只返回前 10 个结果。recommend() 函数用于模拟推荐结果的生成,调用 sort_and_filter() 函数进行结果排序和过滤。在程序中,使用 0 或者 0 以下的值来模拟不需要的结果。

总结

本文介绍了异步协程的基本知识和在推荐系统中的应用,并提供了具体的代码示例。异步协程作为一种高效的并发编程技术,在大数据场景下具有广泛的应用前景。需要注意的是,在实际应用中,需要根据具体的业务需求和技术场景进行针对性的选择和调优,以达到最优的性能表现。

以上是非同步協程開髮指南:建構高效能的推薦系統的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

golang函數與goroutine的父子關係 golang函數與goroutine的父子關係 Apr 25, 2024 pm 12:57 PM

Go中函數與goroutine存在父子關係,父goroutine創建子goroutine,子goroutine可以存取父goroutine的變數但不反之。建立子goroutine使用go關鍵字,子goroutine透過匿名函數或命名的函數執行。父goroutine可以透過sync.WaitGroup等待子goroutine完成,以確保在所有子goroutine完成之前不會退出程式。

並發和協程在Golang API設計中的應用 並發和協程在Golang API設計中的應用 May 07, 2024 pm 06:51 PM

並發和協程在GoAPI設計中可用於:高效能處理:同時處理多個請求以提高效能。非同步處理:使用協程非同步處理任務(例如傳送電子郵件),釋放主執行緒。流處理:使用協程高效處理資料流(例如資料庫讀取)。

Golang協程與 goroutine 的關係 Golang協程與 goroutine 的關係 Apr 15, 2024 am 10:42 AM

協程是並發執行任務的抽象概念,而goroutine是Go語言中的輕量級執行緒功能,實現了協程的概念。兩者聯繫密切,但goroutine資源消耗更低且由Go調度器管理。 goroutine廣泛用於實戰,如同時處理Web請求,提升程式效能。

如何控制 Golang 協程的生命週期? 如何控制 Golang 協程的生命週期? May 31, 2024 pm 06:05 PM

控制Go協程的生命週期可以透過以下方式:建立協程:使用go關鍵字啟動新任務。終止協程:等待所有協程完成,使用sync.WaitGroup。使用通道關閉訊號。使用上下文context.Context。

Python asyncio 進階指南:從初學者到專家 Python asyncio 進階指南:從初學者到專家 Mar 04, 2024 am 09:43 AM

並發和非同步編程並發編程處理同時執行的多個任務,非同步編程是一種並發編程,其中任務不會阻塞線程。 asyncio是python中用於非同步程式設計的函式庫,它允許程式在不阻塞主執行緒的情況下執行I/O操作。事件循環asyncio的核心是事件循環,它監控I/O事件並調度相應的任務。當一個協程準備好時,事件循環會執行它,直到它等待I/O操作。然後,它會暫停協程並繼續執行其他協程。協程協程是可暫停和恢復執行的函數。 asyncdef關鍵字用於建立協程。協程使用await關鍵字等待I/O作業完成。 asyncio的基礎以下

Java異常處理中的非同步與非阻塞技術 Java異常處理中的非同步與非阻塞技術 May 01, 2024 pm 05:42 PM

非同步和非阻塞技術可用於補充傳統異常處理,允許創建更具響應性和高效的Java應用程式:非同步異常處理:在另一個執行緒或進程中處理異常,讓主執行緒繼續執行,避免阻塞。非阻塞異常處理:涉及I/O操作出錯時事件驅動的異常處理,避免阻塞線程,由事件循環處理異常。

Python非同步程式設計: 揭秘非同步程式設計的本質, 最佳化程式碼效能 Python非同步程式設計: 揭秘非同步程式設計的本質, 最佳化程式碼效能 Feb 26, 2024 am 11:20 AM

非同步編程,英文AsynchronousProgramming,是指程式中的某些任務可以並發地執行,而無需等待其他任務完成,從而提高程式的整體運作效率。在python中,asyncio模組是實現非同步程式設計的主要工具,它提供了協程、事件循環和其他非同步程式設計所需的元件。協程:協程(Coroutine)是一種特殊的函數,它可以被暫停然後恢復執行,就像線程一樣,但協程比線程更輕量級,記憶體消耗更低。協程由async關鍵字聲明,並在await關鍵字暫停執行。事件循環:事件循環(EventLoop)是非同步程式設計中的

基於因果推論的推薦系統:回顧與前瞻 基於因果推論的推薦系統:回顧與前瞻 Apr 12, 2024 am 09:01 AM

本次分享的主題為基於因果推論的推薦系統,回顧過去的相關工作,並提出本方向的未來展望。為什麼在推薦系統中需要使用因果推論技術?現有的研究工作用因果推論來解決三類問題(參見Gaoetal.的TOIS2023論文CausalInferenceinRecommenderSystems:ASurveyandFutureDirections):首先,在推薦系統中存在各種各樣的偏差(BIAS),因果推斷是一種有效去除這些偏差的工具。為了解決資料稀缺性和無法準確估計因果效應的問題,推薦系統可能面臨挑戰。為了解決

See all articles