理解GraphRAG(一):RAG的挑戰
RAG(Risk Assessment Grid)是一種透過外部知識來源增強現有大型語言模型(LLM)的方法,以提供和上下文更相關的答案。在RAG中,檢索組件獲取額外的信息,響應基於特定來源,然後將這些信息輸入到LLM提示中,以使LLM的響應基於這些信息(增強階段)。與其他技術(例如微調)相比,RAG更經濟。它也有減少幻覺的優勢,透過基於這些資訊(增強階段)提供額外的脈絡──你RAG成為今天LLM任務的(如推薦、文字擷取、情緒分析等)的流程方法。
如果我們進一步分解這個想法,根據使用者意圖,我們通常會查詢一個向量資料庫。向量資料庫使用連續的向量空間來捕捉兩個概念之間的關係,使用基於接近度的搜尋。
向量資料庫概述
在向量空間中,無論是文字、圖像、音訊或任何其他類型的信息,都被轉換為向量。向量是資料在高維空間的數值表示。每個維度對應資料的一個特徵,每個維度中的值反映了該特徵的強度或存在。 透過向量表示,我們可以對資料進行數學運算、距離計算和相似度比較等操作。不同維度對應的值反映了該特徵的強度或存在與否。 以文字資料為例,可以將每個文件表示為向量,其中每個維度表示一個單字在文件中的出現頻率。這樣,兩個文件可以透過計算它們的向量之間的距離來
在資料庫中進行基於接近度的搜索,涉及並使用另一個向量查詢這些資料庫,並蒐索在向量空間中「接近」它的向量。向量之間的接近度通常由距離測量來決定,例如歐幾里德距離、餘弦相似度或曼哈頓距離。向量之間的接近度通常由距離測量來決定,例如歐幾里德距離、餘弦相似度或曼哈頓距離。
當您在向資料庫中執行搜尋時,您提供了一個系統將其轉換為向量的查詢。然後資料庫計算該查詢向量與資料庫中已儲存的向量之間的距離或相似性。接近查詢向量的向量(根據所選量測量)被認為是最相關的結果。這些最接近查詢向量的向量(根據所選度量)被認為是最相關的結果。
基於接近度的搜尋在向量資料庫中特別強大,適用於推薦系統、資訊檢索和異常檢測等任務。
這種方法使系統能夠更直觀地運行,並透過理解資料中的上下文和深層意義,更有效地回應使用者查詢,而不僅僅依賴於表面匹配。
然而,在應用程式連接到資料庫進行進階搜尋方面存在一些限制,例如資料品質、處理動態知識的能力以及透明度。
RAG的限制
根據文檔的大小,RAG大致分為三類:如果文檔很小,可以上下文存取;如果文檔很大(或有多個文件),在查詢時產生較小的區塊,這些區塊被索引並用於回應查詢。
儘管取得了成功,RAG也有一些缺點。
衡量RAG表現的兩個主要指標是困惑度和幻覺,困惑度代表在文本生成過程中同等可能的下一個詞的選擇數量。即語言模型在其選擇上的「困惑」程度。幻覺是AI做出的不真實或想像的陳述。
雖然RAG有助於減少幻覺,但它並沒有消除它。如果您有一個小而簡潔的文檔,您可以減少困惑度(因為LLM的選擇很少),並減少幻覺(如果您只詢問文檔中的內容)。當然,另一方面是,一個單一的小文檔會導致一個微不足道的應用。對於更複雜的應用,您需要一種提供更多上下文的方法。
例如,考慮單字「bark」-我們至少有兩個不同的上下文:
樹的上下文:「橡樹粗糙的樹皮保護它免受寒冷。 ##提供更多上下文的一種方法是將RAG與知識圖譜結合(一個GRAPHRAG)。
在知識圖譜中,這些單字將與它們相關的上下文和意義連接起來。例如,「bark」將與代表「樹」和「狗」的節點連接。其他連接可以指示常見動作(例如,樹的「保護」、狗的「製造噪音」)或屬性(例如,樹的「粗糙」、狗的「響亮」)。這種結構化資訊允許語言模型根據句子中的其他單字或對話的整體主題選擇適當的意義。
在接下來的部分中,我們將看到RAG的限制以及GRAPHRAG如何解決這些限制。
原文標題:Understanding GraphRAG – 1: The challenges of RAG
##原文作者:ajitjaokar
以上是理解GraphRAG(一):RAG的挑戰的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

譯者|布加迪審校|重樓本文介紹如何使用GroqLPU推理引擎在JanAI和VSCode中產生超快速反應。每個人都致力於建立更好的大語言模型(LLM),例如Groq專注於AI的基礎設施方面。這些大模型的快速響應是確保這些大模型更快捷響應的關鍵。本教學將介紹GroqLPU解析引擎以及如何在筆記型電腦上使用API和JanAI本地存取它。本文也將把它整合到VSCode中,以幫助我們產生程式碼、重構程式碼、輸入文件並產生測試單元。本文將免費創建我們自己的人工智慧程式設計助理。 GroqLPU推理引擎簡介Groq

LeanCopilot,讓陶哲軒等眾多數學家讚不絕口的這個形式化數學工具,又有超強進化了?就在剛剛,加州理工學院教授AnimaAnandkumar宣布,團隊發布了LeanCopilot論文的擴展版本,更新了程式碼庫。圖片論文地址:https://arxiv.org/pdf/2404.12534.pdf最新實驗表明,這個Copilot工具,可以自動化80%以上的數學證明步驟了!這個紀錄,比以前的基線aesop還要好2.3倍。並且,和以前一樣,它在MIT許可下是開源的。圖片他是一位華人小哥宋沛洋,他是

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

圖片來源@視覺中國文|王吉偉從“人+RPA”到“人+生成式AI+RPA”,LLM如何影響RPA人機互動?換個角度,從人機互動看LLM如何影響RPA?影響程式開發與流程自動化人機互動的RPA,現在也要被LLM改變了? LLM如何影響人機互動?生成式AI怎麼改變RPA人機互動?一文看得懂:大模型時代來臨,基於LLM的生成式AI正在快速變革RPA人機交互;生成式AI重新定義人機交互,LLM正在影響RPA軟體架構變遷。如果問RPA對程式開發以及自動化有哪些貢獻,其中一個答案便是它改變了人機互動(HCI,h

Plaud Note AI 錄音機(亞馬遜上有售,售價 159 美元)背後的公司 Plaud 宣布推出一款新產品。該設備被稱為 NotePin,被描述為人工智慧記憶膠囊,與 Humane AI Pin 一樣,它是可穿戴的。 NotePin 是

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

圖檢索增強生成(GraphRAG)正逐漸流行起來,成為傳統向量搜尋方法的強大補充。這種方法利用圖資料庫的結構化特性,將資料以節點和關係的形式組織起來,從而增強檢索資訊的深度和上下文關聯性。圖在表示和儲存多樣化且相互關聯的資訊方面具有天然優勢,能夠輕鬆捕捉不同資料類型間的複雜關係和屬性。而向量資料庫則處理這類結構化資訊時則顯得力不從心,它們更專注於處理高維度向量表示的非結構化資料。在RAG應用中,結合結構化的圖資料和非結構化的文字向量搜索,可以讓我們同時享受兩者的優勢,這也是本文將要探討的內容。構

隨著開源大型語言模型的效能不斷提高,編寫和分析程式碼、推薦、文字摘要和問答(QA)對的效能都有了很大的提高。但當涉及QA時,LLM通常會在未訓練資料的相關的問題上有所欠缺,許多內部文件都保存在公司內部,以確保合規性、商業機密或隱私。當查詢這些文件時,會使得LLM產生幻覺,產生不相關、捏造或不一致的內容。一種處理這項挑戰的可行技術是檢索增強生成(RAG)。它涉及透過引用訓練資料來源以外的權威知識庫來增強回應的過程,以提升生成的品質和準確性。 RAG系統包括一個檢索系統,用於從語料庫中檢索相關文檔片段
