운영 및 유지보수 안전 로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

Jun 12, 2023 am 09:23 AM
최적화 성능 지식 기반

220시간에 걸친 미세 조정 훈련이 어제 완료되었습니다. 주요 작업은 데이터베이스 오류 정보를 보다 정확하게 진단할 수 있는 CHATGLM-6B의 대화 모델을 미세 조정하는 것이었습니다.

로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

열흘 가까이 기다려온 이번 훈련의 최종 결과는 이전에 더 적은 샘플 범위로 했던 훈련과 비교하면 실망스러웠습니다.

로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

이 결과는 여전히 약간 실망 스럽습니다. 이 모델은 기본적으로 실용적인 가치가 없습니다. 매개변수와 훈련 세트를 다시 조정하고 훈련을 다시 수행해야 할 것 같습니다. 대규모 언어 모델의 훈련은 군비 경쟁이며 좋은 장비 없이는 플레이가 불가능합니다. 실험실 장비도 업그레이드해야 할 것 같습니다. 그렇지 않으면 낭비할 시간이 열흘도 채 남지 않을 것입니다.

최근 실패한 미세 조정 훈련으로 볼 때 미세 조정 훈련은 완료하기 쉬운 길이 아닙니다. 훈련을 위해 서로 다른 작업 목표가 혼합되어 있습니다. 서로 다른 작업 목표에는 서로 다른 훈련 매개변수가 필요할 수 있으므로 최종 훈련 세트는 특정 작업의 요구 사항을 충족할 수 없습니다. 따라서 PTUNING은 매우 특정 작업에만 적합하며 혼합 작업을 목표로 하는 모델에는 반드시 FINETUNE을 사용해야 할 필요가 없습니다. 며칠 전 친구와 통화할 때 다들 했던 말과 비슷하다.

사실 모델 훈련이 상대적으로 어렵기 때문에 스스로 모델 훈련을 포기하고 대신 보다 정확한 검색을 위해 로컬 지식 기반을 벡터화한 다음 AUTOPROMPT를 사용하여 검색 결과에서 자동 프롬프트를 생성하는 사람들도 있습니다. .음성 모델에 대해 물어보세요. 이 목표는 langchain을 사용하여 쉽게 달성할 수 있습니다.

로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

작동 원리는 로더를 통해 로컬 문서를 텍스트로 로드한 다음 텍스트를 텍스트 조각으로 분할하고 쿼리에 사용하기 위해 인코딩한 후 벡터 저장소에 쓰는 것입니다. 쿼리 결과가 나오면 Prompt Template을 통해 질문하기 위한 프롬프트가 자동으로 형성되어 LLM에게 질문하고, LLM이 최종 답변을 생성합니다.

이 작업에서 또 다른 중요한 점은 지역 지식 베이스에서 지식을 보다 정확하게 검색하는 것입니다. 이는 검색에 벡터화 및 중국어 및 검색이 수행됩니다. 영어에는 다양한 솔루션이 있습니다. 귀하의 지식 기반에 더 친숙한 솔루션을 선택할 수 있습니다.


로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

위는 OB에 관한 지식베이스를 통해 vicuna-13b에서 진행한 질문과 답변입니다. 위는 로컬 지식베이스를 사용하지 않고 LLM을 직접 사용할 수 있는 능력에 대한 답변입니다. 다음은 로컬 지식베이스에 접속한 후 로딩된 답변입니다. 성능 향상이 확실히 눈에 띄는 것을 볼 수 있습니다.

로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사

로컬 지식 베이스를 사용하기 전에는 LLM이 기본적으로 말도 안 되는 문제를 살펴보겠습니다. 텍스트도 지식 기반의 오류입니다. 실제로 PTUNING에서 사용하는 훈련 세트도 이 로컬 지식 베이스를 통해 생성됩니다.

우리는 최근에 밟은 함정으로부터 약간의 경험을 얻을 수 있습니다. 우선, 피튜닝의 난이도가 생각보다 훨씬 높습니다. 피튜닝에 비해 필요한 장비는 적지만, 훈련 난이도는 전혀 낮지 않습니다. 둘째, LLM 기능을 향상시키기 위해 Langchain과 자동 프롬프트를 통해 로컬 지식 베이스를 사용하는 것이 좋습니다. 대부분의 기업 애플리케이션에서는 로컬 지식 베이스를 정리하고 적합한 벡터화 솔루션을 선택하면 다음과 같은 결과를 얻을 수 있습니다. PTUNING/FINETUNE 효과보다 나쁘지 않습니다. 셋째, 지난번에도 언급했듯이 LLM의 능력이 중요합니다. 사용할 기본 모델로 강력한 LLM을 선택해야 합니다. 모든 임베디드 모델은 기능을 부분적으로만 향상시킬 수 있으며 결정적인 역할을 할 수 없습니다. 넷째, 데이터베이스 관련 지식에 있어서 vicuna-13b는 정말 좋은 능력을 가지고 있습니다.

오늘 아침 일찍 고객님께 연락을 드려야 하는데 오전에는 시간이 부족해서 몇 문장만 쓰겠습니다. 이에 대해 어떻게 생각하시나요? 토론을 위한 메시지를 남겨주세요. (토론 내용은 귀하와 저에게만 표시됩니다.) 저 또한 이 길을 혼자 걷고 있으니 조언을 해줄 수 있는 동료 여행자들이 있기를 바랍니다.

위 내용은 로컬 지식 기반을 사용하여 LLM의 성능을 최적화하는 방법에 대한 기사의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

다양한 Java 프레임워크의 성능 비교 다양한 Java 프레임워크의 성능 비교 Jun 05, 2024 pm 07:14 PM

다양한 Java 프레임워크의 성능 비교: REST API 요청 처리: Vert.x가 최고이며 요청 속도는 SpringBoot의 2배, Dropwizard의 3배입니다. 데이터베이스 쿼리: SpringBoot의 HibernateORM은 Vert.x 및 Dropwizard의 ORM보다 우수합니다. 캐싱 작업: Vert.x의 Hazelcast 클라이언트는 SpringBoot 및 Dropwizard의 캐싱 메커니즘보다 우수합니다. 적합한 프레임워크: 애플리케이션 요구 사항에 따라 선택하세요. Vert.x는 고성능 웹 서비스에 적합하고, SpringBoot는 데이터 집약적 애플리케이션에 적합하며, Dropwizard는 마이크로서비스 아키텍처에 적합합니다.

PHP 배열 키 값 뒤집기: 다양한 방법의 성능 비교 분석 PHP 배열 키 값 뒤집기: 다양한 방법의 성능 비교 분석 May 03, 2024 pm 09:03 PM

PHP 배열 키 값 뒤집기 방법의 성능 비교는 array_flip() 함수가 대규모 배열(100만 개 이상의 요소)에서 for 루프보다 더 나은 성능을 발휘하고 시간이 덜 걸리는 것을 보여줍니다. 키 값을 수동으로 뒤집는 for 루프 방식은 상대적으로 시간이 오래 걸립니다.

C++ 프로그램 최적화: 시간 복잡도 감소 기술 C++ 프로그램 최적화: 시간 복잡도 감소 기술 Jun 01, 2024 am 11:19 AM

시간 복잡도는 입력 크기를 기준으로 알고리즘의 실행 시간을 측정합니다. C++ 프로그램의 시간 복잡성을 줄이는 팁에는 데이터 저장 및 관리를 최적화하기 위한 적절한 컨테이너(예: 벡터, 목록) 선택이 포함됩니다. Quick Sort와 같은 효율적인 알고리즘을 활용하여 계산 시간을 단축합니다. 여러 작업을 제거하여 이중 계산을 줄입니다. 불필요한 계산을 피하려면 조건부 분기를 사용하세요. 이진 검색과 같은 더 빠른 알고리즘을 사용하여 선형 검색을 최적화합니다.

C++에서 멀티스레드 프로그램의 성능을 최적화하는 방법은 무엇입니까? C++에서 멀티스레드 프로그램의 성능을 최적화하는 방법은 무엇입니까? Jun 05, 2024 pm 02:04 PM

C++ 다중 스레드 성능을 최적화하기 위한 효과적인 기술에는 리소스 경합을 피하기 위해 스레드 수를 제한하는 것이 포함됩니다. 경합을 줄이려면 가벼운 뮤텍스 잠금을 사용하세요. 잠금 범위를 최적화하고 대기 시간을 최소화합니다. 동시성을 향상하려면 잠금 없는 데이터 구조를 사용하세요. 바쁜 대기를 피하고 이벤트를 통해 스레드에 리소스 가용성을 알립니다.

벤치마크를 사용하여 Java 기능의 성능을 평가하는 방법은 무엇입니까? 벤치마크를 사용하여 Java 기능의 성능을 평가하는 방법은 무엇입니까? Apr 19, 2024 pm 10:18 PM

Java 기능의 성능을 벤치마킹하는 방법은 JMH(Java Microbenchmark Suite)를 사용하는 것입니다. 구체적인 단계는 다음과 같습니다. 프로젝트에 JMH 종속성을 추가합니다. 새로운 Java 클래스를 생성하고 @State로 주석을 달아 벤치마크 메서드를 나타냅니다. 클래스에 벤치마크 방법을 작성하고 @Benchmark로 주석을 답니다. JMH 명령줄 도구를 사용하여 벤치마크를 실행합니다.

PHP 배열을 객체로 변환하면 성능에 어떤 영향이 있나요? PHP 배열을 객체로 변환하면 성능에 어떤 영향이 있나요? Apr 30, 2024 am 08:39 AM

PHP에서 배열을 객체로 변환하면 성능에 영향을 미치며, 이는 주로 배열 크기, 복잡성, 객체 클래스와 같은 요소의 영향을 받습니다. 성능을 최적화하려면 사용자 지정 반복기 사용, 불필요한 변환 방지, 배열 일괄 변환 및 기타 기술을 고려하세요.

C++와 다른 언어의 성능 비교 C++와 다른 언어의 성능 비교 Jun 01, 2024 pm 10:04 PM

고성능 애플리케이션을 개발할 때 C++는 특히 마이크로 벤치마크에서 다른 언어보다 성능이 뛰어납니다. 매크로 벤치마크에서는 Java, C# 등 다른 언어의 편의성과 최적화 메커니즘이 더 나은 성능을 발휘할 수 있습니다. 실제 사례에서 C++는 이미지 처리, 수치 계산 및 게임 개발에서 우수한 성능을 발휘하며 메모리 관리 및 하드웨어 액세스에 대한 직접적인 제어는 확실한 성능 이점을 제공합니다.

PHP 기능의 비효율성을 해결하는 방법은 무엇입니까? PHP 기능의 비효율성을 해결하는 방법은 무엇입니까? May 02, 2024 pm 01:48 PM

PHP 기능 효율성을 최적화하는 5가지 방법: 불필요한 변수 복사를 방지합니다. 변수 복사를 방지하려면 참조를 사용하세요. 반복되는 함수 호출을 피하세요. 인라인 단순 함수. 배열을 사용하여 루프 최적화.

See all articles