비용 낭비 없이 LLM 사용 - 다양한 데이터베이스 쿼리 전략

WBOY
풀어 주다: 2024-07-25 06:59:52
원래의
716명이 탐색했습니다.

Using LLMs without Burning Dollars - Different Database Query Strategies

AI 기술과 의료 시스템의 지속적인 융합은 많은 놀라운 발전을 가져왔습니다. 장면을 설정해 보겠습니다. ChatGPT와 같은 동적 모델과 상호 작용했다면 우리 중 많은 사람들처럼 고유한 데이터 세트를 사용하여 해당 애플리케이션을 구상하기 시작했을 것입니다. 의료 부문에서 이 기술을 EHR(전자 건강 기록) 또는 EMR(전자 의료 기록)과 연결하거나 FHIR 리소스를 사용하여 상호 운용성을 높이는 것을 목표로 한다고 가정해 보겠습니다.  이 모든 것은 시장에서 사용 가능한 LLM과 상황별 데이터를 전송/수신하는 방법에 달려 있습니다.

보다 정확한 기술에는 미세 조정, 컨텍스트 데이터세트만을 사용한 LLM 교육이 포함됩니다. 단, 오늘날 이를 달성하는 데는 수백만 달러가 소요됩니다. 다른 방법은 일회성 또는 소수 쿼리를 통해 LLM에 컨텍스트를 제공하고 답변을 얻는 것입니다. 이를 달성할 수 있는 몇 가지 방법으로는 SQL 쿼리 생성, 쿼리/구문 분석을 위한 코드 생성, API 사양의 정보를 사용한 호출 등이 있습니다. 하지만 높은 토큰 소모 문제가 있으며 이러한 답변 중 일부는 항상 정확하지 않을 수 있습니다.

여기서 모든 마법에 맞는 하나의 솔루션은 없지만 이러한 기술의 장단점을 이해하면 자신만의 전략을 고안하는 데 도움이 될 수 있습니다. 또한 좋은 엔지니어링 사례(예: 캐시, 보조 저장소)를 활용하고 문제 해결에 집중하면 사용 가능한 방법 간의 균형을 찾는 데 도움이 될 수 있습니다. 이 게시물은 몇 가지 전략을 공유하고 다양한 지표에 따라 전략을 비교하려는 시도입니다.

SQL 쿼리 생성

첫째, LangChain을 통해 SQL 데이터베이스 구조와 샘플 콘텐츠를 로드 및 구문 분석하고 GPT 쿼리를 실행하는 보다 일반적인 방법이 있습니다. 이 방법은 의료 시스템과의 효율적이고 역동적인 커뮤니케이션을 촉진하는 기록을 보유하고 있으며 업계에서 검증된 기술임을 입증했습니다.

데이터베이스 구조(예: 테이블 스키마)만 전달하는 솔루션과 LLM이 정확한 쿼리를 생성하는 데 도움이 되도록 일부 수정된 데이터를 전달하는 솔루션이 있습니다. 전자의 솔루션은 고정된 토큰 사용량과 예측 가능한 비용이라는 장점이 있지만 상황을 완전히 인식하지 못하기 때문에 정확성이 저하됩니다. 후자의 솔루션은 토큰 집약적일 수 있으며 익명화 기술에 대한 특별한 주의가 필요합니다.  이러한 솔루션은 일부 사용 사례에 완벽할 수 있지만 더 최적의 전략이 있을까요?

LLM을 사용하여 API 및 데이터베이스 쿼리 탐색을 위한 코드 생성

또 다른 정교한 기술은 LLM이 질문을 여러 쿼리 또는 API 호출로 분류하는 코드를 생성하도록 하는 것입니다. 이는 복잡한 질문을 해결하는 매우 자연스러운 방법이며 자연어와 기본 코드를 결합하는 힘을 발휘합니다.

이 솔루션을 사용하려면 모든 코너 케이스에 잘 작동하도록 적절한 프롬프트 엔지니어링과 템플릿 프롬프트의 미세 조정이 필요합니다. 이 솔루션을 기업 환경에 맞추는 것은 토큰 사용, 보안 코드 생성, 생성된 코드에서 액세스할 수 있는 것과 없는 것의 경계 제어의 불확실성으로 인해 어려울 수 있습니다. 그러나 전체적으로 복잡한 문제를 해결하기 위해 자율적으로 작동하는 이 기술의 힘은 매우 흥미롭고 이 분야의 추가 발전이 기대됩니다.

OpenAPI 사양을 LLM에 대한 컨텍스트로 로드

저희 팀은 토큰 사용을 제어하는 ​​동시에 사용 가능한 컨텍스트를 활용하여 정확한 결과를 얻기 위해 다른 접근 방식을 시도하고 싶었습니다. FHIR의 OpenAPI 사양을 로드하고 구문 분석하기 위해 LangChain을 사용하는 것은 어떻습니까? OpenAPI는 적응력 있고 표준화된 절차를 갖춘 영향력 있는 대안으로 제시되어 FHIR의 포괄적인 API 표준의 중요성을 입증합니다. 뚜렷한 장점은 다양한 시스템 간의 간편한 데이터 교환을 촉진한다는 것입니다. 여기서 제어할 수 있는 점은 LLM에서 프롬프트나 생성된 출력이 아니라 사양 자체를 수정할 수 있다는 것입니다.

시나리오를 상상해 보십시오. POST API는 데이터가 데이터베이스에 추가되기 전에 필요한 모든 유효성 검사를 수행합니다. 이제 동일한 POST API를 활용하지만 자연어 방법을 사용하는 것을 상상해보세요. 여전히 동일한 엄격한 검사를 수행하여 일관성과 신뢰성을 보장합니다. OpenAPI의 이러한 특성은 의료 서비스 및 애플리케이션과의 상호 작용을 단순화할 뿐만 아니라 API 이해도를 향상시켜 이해하기 쉽고 예측 가능하게 만듭니다.

우리는 이 솔루션이 자동으로 작업을 분할하거나 코드를 생성하는 것과 동일한 힘을 갖고 있지 않다는 것을 알고 있지만 이는 대부분의 사용 사례에 신속하게 적용할 수 있는 보다 실용적인 솔루션에 도달하는 것을 목표로 합니다.

비교

이러한 모든 기술은 고유한 이점과 다양한 목적을 달성할 수 있는 잠재력을 보여 주지만 몇 가지 지표를 기준으로 성능을 평가해 보겠습니다.

1. 신뢰성 - AI와의 제휴를 고려하여 신뢰성을 최우선으로 생각하는 OpenAPI는 표준화된 API를 활용한다는 장점이 있습니다. 이를 통해 특정 데이터에 대한 무단 액세스를 제한하고 정확한 사용자 인증을 보장하여 잠재적으로 신뢰성 문제를 일으킬 수 있는 방법인 DB 액세스를 위해 AI 생성 SQL을 전달하는 것에 비해 향상된 데이터 보안을 제공합니다.

2. 비용 - FHIR에서 정의한 API 필터링 기능의 효율성이 비용 절감에 중요한 역할을 합니다. 이는 필요한 것보다 많은 레코드를 반환할 수 있는 기존 DB와 달리 강력한 프롬프트 엔지니어링을 통해 간소화된 꼭 필요한 데이터만 거래할 수 있게 하여 불필요한 비용 급증을 초래합니다.

3. 성능 - OpenAPI 사양에 따른 체계적이고 표준화된 데이터 표현은 종종 GPT-4 모델의 우수한 출력 결과에 기여하여 성능을 향상시킵니다. 그러나 SQL DB는 직접 쿼리에 대해 더 신속하게 결과를 반환할 수 있습니다. 쿼리에 필요한 것보다 더 많은 매개변수 정의로 인해 Open API에서 과도한 정보를 제공할 가능성을 고려하는 것이 중요합니다.

4. 상호 운용성 - OpenAPI 사양은 상호 운용성 측면에서 빛을 발합니다. 플랫폼 독립적이기 때문에 의료 분야의 상호 운용성을 강화하고 다른 시스템과의 원활한 동기화를 위한 협업 환경을 조성하려는 FHIR의 사명에 완벽하게 부합합니다.

5. 구현 및 유지 관리 - DB를 분리하고 쿼리를 위해 AI에 컨텍스트를 제공하는 것이 상대적으로 쉬울 수 있지만 린 제어 계층을 사용하는 SQL 데이터베이스 로딩 방법은 구현하기 더 쉬워 보일 수 있지만 OpenAPI 사양 , 일단 마스터하면 초기 학습 및 실행 곡선보다 중요한 표준화 및 손쉬운 유지 관리와 같은 이점을 제공합니다.

6. 확장성 및 유연성 - SQL 데이터베이스는 확장성과 유연성을 편안하게 허용하지 않는 엄격한 스키마를 요구합니다. SQL과 달리 OpenAPI는 보다 적응력이 뛰어나고 확장 가능한 솔루션을 제공하므로 미래 친화적인 대안이 됩니다.

7. 윤리와 우려사항 - AI의 급속한 성장을 고려할 때 중요하면서도 고려해야 할 복잡한 요소입니다. 필터와 인증을 사용하더라도 고객에게 직접 DB 액세스를 제공하는 것이 편하십니까? 의료 공간 내에서 개인정보 보호를 보장하는 데 있어 데이터 비식별자의 중요성을 생각해 보세요. OpenAPI와 SQL 데이터베이스 모두 이러한 문제를 해결하는 메커니즘을 갖추고 있지만 OpenAPI가 제공하는 고유한 표준화는 추가적인 보안 계층을 추가합니다.

이 토론은 고려해야 할 몇 가지 주요 요소에 대한 통찰력을 제공하지만 SQL, 코드 생성 및 OpenAPI 사이의 선택은 다면적이며 프로젝트 및 조직의 특정 요구 사항에 따라 달라질 수 있다는 점을 인식하는 것이 중요합니다.

이 주제에 대한 귀하의 생각과 관점을 자유롭게 공유해 주십시오. 추가로 제안할 사항이 있거나 귀하의 사용 사례에 가장 적합한 몇 가지 예를 공유하고 싶을 수도 있습니다.

위 내용은 비용 낭비 없이 LLM 사용 - 다양한 데이터베이스 쿼리 전략의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿