검색 세대 (RAG) : 재무 데이터 분석 혁신
이 기사는 금융 회사에서 검색-대기 세대 (RAG)의 인기가 높아지는 것을 탐구하며, 지식 액세스를 간소화하고 LLM 중심 솔루션의 주요 과제를 해결하는 방법에 중점을 둡니다. RAG는 리트리버 (관련 문서 찾기)를 대형 언어 모델 (LLM) (응답 합성)과 결합하여 고객 지원, 연구 및 내부 지식 관리와 같은 작업에 귀중한 것으로 입증됩니다.
효과적인 LLM 평가가 중요합니다. TDD (Test-Driven Development)에서 영감을 얻은 평가 중심의 접근 방식은 측정 가능한 벤치 마크를 사용하여 AI 워크 플로를 검증하고 개선합니다. Rag의 경우 여기에는 대표적인 입력 출력 쌍 (예 : 챗봇의 Q & A 쌍 또는 소스 문서 및 예상 요약)을 작성하는 것이 포함됩니다. 전통적 으로이 데이터 세트 생성은 주제 전문가 (SME)에 크게 의존하여 시간 소모, 일관성이없고 비용이 많이 드는 프로세스로 이어졌습니다. 또한 문서 (테이블, 다이어그램) 내에서 시각적 요소를 처리하는 LLMS의 제한은 정확도를 방해했으며 표준 OCR 도구가 종종 짧아졌습니다.
멀티 모달 기능으로 도전을 극복합니다
멀티 모달 파운데이션 모델의 출현은 솔루션을 제공합니다. 이 모델은 텍스트와 시각적 컨텐츠를 모두 처리하여 별도의 텍스트 추출이 필요하지 않습니다. 그들은 전체 페이지를 섭취하고 레이아웃 구조, 차트 및 테이블을 인식하여 정확도, 확장 성을 향상 시키며 수동 노력을 줄일 수 있습니다.
사례 연구 : 자산 관리 연구 보고서 분석
이 연구는 2023 Cerulli 보고서 (텍스트와 복잡한 시각을 결합한 전형적인 자산 관리 문서)를 사용하여 자동화 된 Q & A 쌍 생성을 보여줍니다. 목표는 시각적 요소를 포함하는 질문을 생성하고 신뢰할 수있는 답변을 만드는 것이 었습니다. 이 프로세스는 Anthropic의 Claude Sonnet 3.5를 사용하여 PDF- 이미지 변환을 내부적으로 처리하여 워크 플로를 단순화하고 코드 복잡성을 줄였습니다.
프롬프트는 모델에 특정 페이지를 분석하고, 페이지 제목을 식별하고, 시각적 또는 텍스트 내용을 참조하는 질문을 만들고, 각 질문에 대해 두 가지 다른 답을 생성하도록 지시했습니다. 비교 학습 접근법이 구현되어 평가를위한 두 가지 답변을 제시하고 우수한 응답을 선택했습니다. 이것은 대안을 비교하면 프로세스를 단순화하는 인간의 의사 결정을 반영합니다. 이는 LLM을 사용하여 1 년간 건축에서 배운 것 "에서 강조된 모범 사례와 일치하며 LLM 평가를위한 쌍별 비교의 안정성을 강조합니다.
Claude Opus는 고급 추론 능력을 갖춘 "판사"역할을했으며 명확성과 직접성과 같은 기준에 따라 더 나은 답변을 선택했습니다. 이는 수동 중소기업 검토를 크게 줄여 확장 성과 효율성을 향상시킵니다. 초기 중소기업 스팟 확인이 필수적이지만, 시스템 신뢰가 커짐에 따라 시간이 지남에 따라이 의존성이 감소합니다.
워크 플로 최적화 : 캐싱, 배치 및 페이지 선택
몇 가지 최적화가 구현되었습니다 :
캐싱 : 캐싱 비용이 크게 줄었습니다. 캐싱없이 보고서를 처리하는 데 $ 9; 캐싱의 경우 $ 3 (3 배의 절약) 비용이 들었습니다. 비용 절감은 규모에 따라 훨씬 더 극적입니다.
배치 처리 : Anthropic의 배치 사용 API 절반 출력 비용으로 개별 처리보다 훨씬 비용 효율적입니다.
페이지 선택 :
10 페이지 배치로 문서를 처리하면 정밀도와 효율성 사이에 최상의 균형을 얻었습니다. 명확한 페이지 제목을 앵커로 사용하는 것은 Q & A 쌍을 소스에 연결하기 위해 페이지 번호에만 의존하는 것보다 더 신뢰할 수있는 것으로 판명되었습니다.
예제 출력 및 혜택
예제는 AUM 분포에 대한 질문에 답변하기 위해 보고서 내 테이블의 LLM이 정확하게 합성 된 정보를 보여줍니다. 전반적인 혜택은 다음과 같습니다
-
캐싱 및 배치 처리를 통한 상당한 비용 절감
중소기업의 시간과 노력이 줄어들어 고가의 작업에 집중할 수 있습니다.
이 접근법은 RAG 시스템에 대한 평가 데이터 세트를 생성하기위한 확장 가능하고 비용 효율적인 솔루션을 보여 주며, 멀티 모달 LLM의 힘을 활용하여 재무 데이터 분석의 정확성과 효율성을 향상시킵니다. 원본 텍스트의 이미지는 다음과 같습니다
-
위 내용은 LLM을 사용한 합성 데이터 생성의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!