> 기술 주변기기 > 일체 포함 > 강화 래그 : 바닐라 접근을 넘어서

강화 래그 : 바닐라 접근을 넘어서

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
풀어 주다: 2025-02-25 16:38:09
원래의
628명이 탐색했습니다.

Enhancing RAG: Beyond Vanilla Approaches RAG (Retrieval-Augmented Generation)는 외부 정보 검색을 통합하여 언어 모델을 크게 향상시킵니다. 표준 래그는 응답 관련성을 향상시키면서 종종 복잡한 검색 상황에서 흔들립니다. 이 기사는 기본 래그의 단점을 검토하고 정확도와 효율성을 향상시키는 고급 방법을 제시합니다. 기본 래그의 한계

간단한 시나리오를 고려하십시오 : 여러 문서에서 관련 정보를 검색하십시오. 우리의 데이터 세트에는 다음이 포함됩니다

건강하고 생산적인 라이프 스타일 관행을 자세히 설명하는 기본 문서 겹치는 키워드가 포함 된 두 개의 관련없는 문서이지만 다른 맥락에서.

기본 헝겊 시스템, 다음과 같이 질문 할 때 :

건강과 생산성을 어떻게 향상시킬 수 있습니까?

    건강하고 생산적인 라이프 스타일을위한 최고의 전략은 무엇입니까?
  • 관련이없는 문서에서 유사한 단어가 있으므로 기본 문서를 지속적으로 검색하는 데 어려움을 겪을 수 있습니다. 헬퍼 기능 : 헝겊 파이프 라인을 간소화
  • 검색 정확도를 향상시키고 쿼리 처리를 단순화하기 위해 도우미 기능을 소개합니다. 이러한 기능은 ChatGpt API 쿼리, 문서 임베딩 계산 및 유사성 점수 결정과 같은 작업을 처리합니다. 이것은보다 효율적인 헝겊 파이프 라인을 만듭니다.
  • 여기에는 헬퍼 함수가 있습니다 :
<code>main_document_text = """
Morning Routine (5:30 AM - 9:00 AM)
✅ Wake Up Early - Aim for 6-8 hours of sleep to feel well-rested.
✅ Hydrate First - Drink a glass of water to rehydrate your body.
✅ Morning Stretch or Light Exercise - Do 5-10 minutes of stretching or a short workout to activate your body.
✅ Mindfulness or Meditation - Spend 5-10 minutes practicing mindfulness or deep breathing.
✅ Healthy Breakfast - Eat a balanced meal with protein, healthy fats, and fiber.
✅ Plan Your Day - Set goals, review your schedule, and prioritize tasks.
...
"""</code>
로그인 후 복사
로그인 후 복사

    기본 래그 평가
  1. 우리는 사전 정의 된 쿼리를 사용하여 기본 래그를 테스트하여 의미 론적 유사성을 기반으로 가장 관련성이 높은 문서를 검색하는 능력을 평가합니다. 이것은 그 한계를 강조합니다.
  2. 향상된 래그를위한 고급 기술
  3. 검색 프로세스를 개선하기 위해 문서 검색 및 쿼리 처리를 향상시키기 위해 구조화 된 정보를 생성하는 기능을 소개합니다. 세 가지 주요 향상이 구현됩니다 : 1. FAQ 생성 문서에서 FAQ 생성은 쿼리 일치 가능성을 확장합니다. 이 FAQ는 한 번 생성되어 저장되어 반복 비용없이 검색 공간을 풍부하게합니다.
2. 개요 생성

간결한 요약은 문서의 핵심 아이디어를 포착하여 검색 효과를 향상시킵니다. 개요의 임베딩은 문서 수집에 추가됩니다

3. 쿼리 분해

광범위한 쿼리는 더 작고 정확한 하위 쿼리로 나뉩니다. 이 하위 쿼리는 향상된 문서 컬렉션 (원본 문서, FAQ 및 개요)과 비교됩니다. 관련성 향상을 위해 결과가 병합됩니다
<code>main_document_text = """
Morning Routine (5:30 AM - 9:00 AM)
✅ Wake Up Early - Aim for 6-8 hours of sleep to feel well-rested.
✅ Hydrate First - Drink a glass of water to rehydrate your body.
✅ Morning Stretch or Light Exercise - Do 5-10 minutes of stretching or a short workout to activate your body.
✅ Mindfulness or Meditation - Spend 5-10 minutes practicing mindfulness or deep breathing.
✅ Healthy Breakfast - Eat a balanced meal with protein, healthy fats, and fiber.
✅ Plan Your Day - Set goals, review your schedule, and prioritize tasks.
...
"""</code>
로그인 후 복사
로그인 후 복사

강화 된 헝겊 평가 이러한 개선 사항으로 초기 쿼리를 다시 실행하면 상당한 개선이 나타납니다. 쿼리 분해는 여러 하위 쿼리를 생성하여 FAQ와 원본 문서 모두에서 성공적인 검색으로 이어집니다. 예제 FAQ 출력 : 비용-편익 분석

전처리 (FAQ, 개요 및 임베드 생성)는 선불 비용을 추가하는 동안 문서 당 일회성 비용입니다. 이것은 불완전한 래그 시스템의 비 효율성을 상쇄합니다. 좌절 된 사용자와 관련없는 정보를 검색하여 쿼리 비용이 증가합니다. 대량 시스템의 경우, 전처리는 가치있는 투자입니다 결론

문서 전처리 (FAQ 및 개요)를 쿼리 분해와 결합하면 정확성과 비용 효율성의 균형을 맞추는보다 지능적인 헝겊 시스템을 만듭니다. 이는 검색 품질을 향상시키고 관련이없는 결과를 줄이며 사용자 경험을 향상시킵니다. 향후 연구는 쿼리 정제를위한 동적 임계 값 및 강화 학습과 같은 추가 최적화를 탐구 할 수 있습니다.

위 내용은 강화 래그 : 바닐라 접근을 넘어서의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿