了解命中率,MRR和MMR指標
介紹
想像一下瀏覽書店以進行完美閱讀。您渴望特定於流派的建議,但希望發現新作者的多樣性。檢索增強的生成(RAG)系統的功能相似,將信息檢索與創意響應生成融為一體。評估其績效需要指標,例如命中率(衡量成功的建議)和平均相互等級(MRR,考慮建議順序)。最大邊緣相關性(MMR)確保了建議的相關性和多樣性。這些指標保證了準確,多樣化和引人入勝的建議。
概述
本指南探討了命中率,MMR及其在評估抹布系統中的作用。您將學會將MMR用於在檢索結果中平衡相關性和多樣性,計算命中率和MRR評估檢索有效性,並使用這些性能指標分析/改善抹布系統。
目錄
- 什麼是命中率?
- 計算命中率
- 命中率限制
- 平均相互等級(MRR)
- 計算MRR
- 最大邊緣相關性(MMR)
- 計算MMR
- MMR示例
- 常見問題
什麼是命中率?
命中率通過測量所需項目在頂級建議中出現的頻率來評估建議系統性能。在抹布中,它表示成功將相關數據納入生成的輸出的頻率。
計算命中率?
命中率是通過將相關項目出現在頂級建議中的查詢數量除以查詢總數的查詢數量來計算的。數學上:
示例:三個查詢(Q1,Q2,Q3),帶有相應的目標節點(N1,N2,N3)。檢索的節點是:
Q1的命中率為1,Q3為0。所以:
命中率限制
命中率的主要限制是無視檢索到的節點的位置。考慮兩個獵犬:
兩者都具有相同的命中率(66.66%),但是Retriever 2始終將正確的節點排名更高(位置1比Q1的位置3)。這凸顯了對考慮排名的度量的需求。
平均相互等級(MRR)
平均相互等級(MRR)通過考慮排名列表中的第一個相關項目的等級來評估信息檢索系統。在RAG中,它評估了檢索組件在尋找相關文檔以進行準確響應生成時的性能。
計算MRR?
其中n是查詢的數量,而ranki是查詢i的第一個相關文檔的等級。
例子:
Q1的MRR為1/3。所以:
請注意,儘管命中率達到66.66%,但MRR為44.4%,獎勵將相關物品更高的檢索員獎勵。
最大邊緣相關性(MMR)
最大邊緣相關性(MMR)重新排列結果以優化相關性和多樣性。它可以平衡新穎性和相關性,以確保已檢索的項目全面解決查詢方面。
計算MMR?
λ(mmr_threshold)控制相關性/多樣性權衡。接近1的λ優先考慮相關性;接近0的λ優先考慮多樣性。
MMR示例
使用與HIT率相同的示例,具有相關性和相似性得分,λ= 0.5:
原始文檔中提供了Q1,Q2和Q3的詳細MMR計算和重新排列。最終重新排列的節點說明了MMR在相關性和多樣性之間達到的平衡。
結論
命中率,MRR和MMR對於評估和改善抹布系統至關重要。命中率和MRR專注於相關信息檢索頻率和排名,而MMR平衡相關性和多樣性。優化這些指標可增強抹布系統的響應質量和用戶體驗。
常見問題
Q1。什麼是命中率?答:這是最高建議中的查詢與相關項目與查詢總數的比率。
Q2。什麼是MMR?答:最大的邊際相關性是一種重新排列技術,平衡了檢索結果中的相關性和多樣性。
Q3。為什麼命中率對抹布很重要?答:更高的命中率表明更好地檢索相關信息,從而導致更準確的響應。
Q4。為什麼MMR對抹布很重要? A. MMR確保各種各樣的相關結果,為查詢提供全面的答案。
以上是了解命中率,MRR和MMR指標的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t
