> 기술 주변기기 > 일체 포함 > 래그 성능 향상 방법 : 예제가있는 5 가지 주요 기술

래그 성능 향상 방법 : 예제가있는 5 가지 주요 기술

Joseph Gordon-Levitt
풀어 주다: 2025-03-07 09:22:09
원래의
936명이 탐색했습니다.
검색 증강 생성 (RAG)은 외부 데이터를 통합하여 큰 언어 모델 (LLM) 정확도 및 신뢰성을 크게 향상시킵니다. 이를 통해 답변을 작성하고 재교육하지 않고 업데이트를 허용합니다. 그러나 Rag는 보편적으로 효과적이지 않습니다. 이 기사는 강력한 걸레 파이프 라인 구축, 제한 사항을 탐색하며 솔루션을 제공합니다.

Openai 기초 (간단한 언급, 확장 할 필요 없음) OpenAI API 사용에 대해 자세히 알아보십시오. 지금 시작하십시오

헝겊의 작동 방식 :

(llamaindex 문서의 이미지) Rag Pipeline은 인덱싱, 검색 및 생성의 세 단계로 구성됩니다.

인덱스 : 데이터 (다양한 형식)는 정리하고 일반 텍스트로 변환되고 관리 가능한 조각으로 뭉쳐지고 삽입 모델을 사용하여 수치 벡터 (임베딩)로 변환됩니다. 이러한 임베딩 및 청크는 효율적인 검색을 위해 색인화됩니다 검색 : 사용자 쿼리는 동일한 임베딩 모델을 사용하여 벡터화됩니다. 이 시스템은 쿼리 벡터와 인덱스 청크 벡터 사이의 유사성 점수를 계산하여 상단 K를 가장 유사한 청크를 검색합니다.

Generation : How to Improve RAG Performance: 5 Key Techniques with Examples 쿼리 및 검색된 청크는 프롬프트로 형식화되어 답변 생성을 위해 LLM에 공급됩니다.

헝겊 제한 : 각 단계에는 도전이 존재합니다

인덱싱 : 시끄러운 데이터는 도움이되지 않는 LLM 응답으로 이어집니다 검색 :

시스템이 항상 관련 청크를 검색하는 것은 아닙니다 생성 :
  • 좋은 검색으로도 LLM은 잘못된 답변을 환각시킬 수 있습니다.

    헝겊 성능 향상 : 3 가지 주요 전략은 이러한 제한 사항을 다루고 있습니다 : 청킹, 재 계급 및 쿼리 변환. 다음은 Llamaindex와 Openai API를 사용하여 Wikipedia 항목 (Emma Stone, Ryan Gosling, La La Land)에 대한 질문에 답변합니다. 기준 래그 시스템 : 필요한 패키지를 설치하십시오 :

    OpenAI API 키를 설정하십시오
  • wikipedia 데이터를로드하고 색인을 구축하십시오 :
  • 컨텍스트 기반 답변을 보장하기 위해 프롬프트 템플릿을 만듭니다

    (초기 쿼리 및 서브 패러 응답은 간결하게 생략됩니다. 초점은 개선 전략에 중점을 둡니다.) . 덩어리로 개선 :

  • 를 조정하여 를 를 최적화하려면 리 랭킹을 사용하여 개선 :

(FlagembeddingReranker 및 RankgpTrerank의 코드 예제는 간결하게 생략되지만 설명은 남아 있습니다)

FlagembeddingReranker :
    는 껴안는 얼굴 재 속성 모델 (예 : )을 사용하여 청크 관련성을 향상시킵니다. 포옹 페이스 액세스 토큰이 필요합니다.
  • rankgptrerank : 는 의미 론적 이해를 바탕으로 검색 된 청크를 다시 평가하기 위해 llm (예 : )을 사용합니다. BAAI/bge-reranker-base

  • 쿼리 변환으로 개선 :
  • (하이드 및 다중 단계 쿼리 변환에 대한 코드 예제는 간결하게 생략되지만 설명은 남아 있습니다. gpt-3.5-turbo-0125 Hyde (가상의 문서 임베드) :

    가상의 대답을 생성하고, 쿼리와 가상의 대답에 대한 임베딩을 생성하고, 이러한 임베드에 가장 가까운 문서를 검색합니다.
다중 단계 쿼리 변환 :

보다 효과적인 처리를 위해 복잡한 쿼리를 간단한 하위 쿼리로 나눕니다.

결론 :

이 기사는 래그 성능을 향상시키기위한 몇 가지 기술을 보여주었습니다. 최적의 접근법은 특정 응용 프로그램 및 원하는 결과에 따라 다릅니다. Rag의 추가 탐색은 [Code-anong videos 링크]에서 찾을 수 있습니다.

위 내용은 래그 성능 향상 방법 : 예제가있는 5 가지 주요 기술의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿