목차
특정 자연어 처리 작업을 위한 시스템을 구축하는 것은 일반적으로 매우 복잡합니다. 시스템 구축자는 작업 범위를 명확하게 정의하고, 특정 데이터 세트를 획득하고, 적절한 모델 아키텍처를 선택하고, 모델을 훈련 및 평가한 후 실제 적용을 위해 배포해야 합니다.
Framework
실험 및 결과
요약
기술 주변기기 일체 포함 소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!

소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!

Sep 11, 2023 pm 04:33 PM
ai 데이터

대규모 언어 모델(LLM)을 사용하면 사용자는 힌트와 상황별 학습을 통해 강력한 자연어 처리 시스템을 구축할 수 있습니다. 그러나 다른 관점에서 볼 때 LLM은 일부 특정 자연어 처리 작업에서 특정 회귀를 보여줍니다. 이러한 모델을 배포하려면 많은 컴퓨팅 리소스가 필요하며 API를 통해 모델과 상호 작용하면 잠재적인 개인 정보 보호 문제가 발생할 수 있습니다. 이러한 문제를 해결하기 위해 Carnegie Mellon University(CMU)와 Tsinghua University의 연구원들은 Prompt2Model 프레임워크를 공동으로 출시했습니다. 이 프레임워크의 목표는 LLM 기반 데이터 생성 및 검색 방법을 결합하여 위의 과제를 극복하는 것입니다. Prompt2Model 프레임워크를 사용하면 사용자는 LLM과 동일한 프롬프트만 제공하면 자동으로 데이터를 수집하고 특정 작업에 적합한 소규모 특수 모델을 효율적으로 교육할 수 있습니다.

연구원들은 세 가지 자연어 처리 하위 시스템 작업에 대해 연구한 실험을 수행했습니다. 그들은 소수의 샘플 프롬프트를 입력으로 사용했으며 데이터 수집과 20분의 교육에 5달러만 소비했습니다. Prompt2Model 프레임워크를 통해 생성된 모델의 성능은 강력한 LLM 모델 gpt-3.5-turbo보다 ​​20% 더 높습니다. 동시에 모델의 크기도 700배로 줄어들었습니다. 연구원들은 실제 시나리오에서 이러한 데이터가 모델 성능에 미치는 영향을 추가로 확인하여 모델 개발자가 배포 전에 모델의 신뢰성을 추정할 수 있도록 했습니다. 프레임워크는 오픈 소스 형식으로 제공되었습니다:

소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!


프레임워크의 GitHub 저장소 주소: https://github.com/neulab/prompt2model

  • 프레임워크 데모 비디오 링크: youtu. be/LYYQ_EhGd -Q
  • 프레임워크 관련 논문 링크: https://arxiv.org/abs/2308.12261
  • Background

특정 자연어 처리 작업을 위한 시스템을 구축하는 것은 일반적으로 매우 복잡합니다. 시스템 구축자는 작업 범위를 명확하게 정의하고, 특정 데이터 세트를 획득하고, 적절한 모델 아키텍처를 선택하고, 모델을 훈련 및 평가한 후 실제 적용을 위해 배포해야 합니다.

대규모 언어 모델( GPT-3과 같은 LLM)은 이 프로세스에 대한 더 간단한 솔루션을 제공합니다. 사용자는 작업 지침과 몇 가지 예만 제공하면 LLM이 해당 텍스트 출력을 생성할 수 있습니다. 그러나 힌트에서 텍스트를 생성하는 것은 계산 집약적일 수 있으며 힌트를 사용하는 것은 특별히 훈련된 모델보다 덜 안정적입니다. 또한 LLM의 유용성은 비용, 속도 및 개인 정보 보호로 인해 제한됩니다. 이러한 문제를 해결하기 위해 연구원들은 Prompt2Model 프레임워크를 개발했습니다. 이 프레임워크는 LLM 기반 데이터 생성 및 검색 기술을 결합하여 위의 한계를 극복합니다. 시스템은 먼저 프롬프트 정보에서 주요 정보를 추출한 다음 훈련 데이터를 생성 및 검색하고 마지막으로 배포 준비가 된 특수 모델을 생성합니다

Prompt2Model 프레임워크는 자동으로 다음 핵심 단계를 수행합니다. 1. 데이터 전처리: 입력 데이터를 정리하고 표준화하여 모델 교육에 적합한지 확인합니다. 2. 모델 선택: 작업 요구 사항에 따라 적절한 모델 아키텍처와 매개변수를 선택합니다. 3. 모델 훈련: 전처리된 데이터를 사용하여 선택한 모델을 훈련하여 모델의 성능을 최적화합니다. 4. 모델 평가: 특정 작업에 대한 성능을 결정하기 위한 평가 지표를 통해 훈련된 모델의 성능을 평가합니다. 5. 모델 튜닝: 평가 결과를 바탕으로 모델을 튜닝하여 성능을 더욱 향상시킵니다. 6. 모델 배포: 훈련된 모델을 실제 애플리케이션 환경에 배포하여 예측 또는 추론 기능을 달성합니다. Prompt2Model 프레임워크는 이러한 핵심 단계를 자동화함으로써 사용자가 고성능 자연어 처리 모델

데이터 세트 및 모델 검색: 관련 데이터 세트 및 사전 훈련된 모델을 수집합니다.

데이터세트 생성: LLM을 사용하여 의사 레이블이 지정된 데이터세트를 만듭니다.

  • 모델 미세 조정: 검색된 데이터와 생성된 데이터를 혼합하여 모델을 미세 조정합니다.
  • 모델 테스트: 테스트 데이터 세트와 사용자가 제공한 실제 데이터 세트에서 모델을 테스트합니다.
  • 다양한 작업에 대한 실증적 평가를 통해 Prompt2Model의 비용이 대폭 절감되고 모델의 크기도 대폭 줄어들었지만 성능은 gpt-3.5-turbo를 능가하는 것으로 나타났습니다. Prompt2Model 프레임워크는 자연어 처리 시스템을 효율적으로 구축하기 위한 도구로 사용할 수 있을 뿐만 아니라 모델 통합 교육 기술을 탐색하기 위한 플랫폼으로도 사용할 수 있습니다

Framework

소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!

Prompt2Model 프레임워크의 핵심 기능은 높은 수준의 자동화입니다. 위 그림과 같이 프로세스에는 데이터 수집, 모델 교육, 평가 및 배포가 포함됩니다. 그 중 자동화된 데이터 수집 시스템은 데이터 세트 검색 및 LLM 기반 데이터 생성을 통해 사용자 요구와 밀접하게 관련된 데이터를 얻는 핵심 역할을 합니다. 다음으로 사전 훈련된 모델을 검색하고 획득한 데이터 세트에서 미세 조정합니다. 마지막으로 훈련된 모델은 테스트 세트에서 평가되고 모델과 상호 작용하기 위한 웹 사용자 인터페이스(UI)가 생성됩니다.

Prompt2Model 프레임워크의 주요 기능은 다음과 같습니다.

  • Prompt 드라이버: Prompt2Model 핵심 아이디어 프롬프트를 드라이버로 사용하면 사용자가 기계 학습의 구체적인 구현 세부 사항을 다루지 않고도 필요한 작업을 직접 설명할 수 있다는 점입니다.
  • 자동 데이터 수집: 프레임워크는 데이터 세트 검색 및 생성 기술을 사용하여 사용자의 작업과 매우 일치하는 데이터를 획득함으로써 훈련에 필요한 데이터 세트를 구축합니다.
  • 사전 훈련된 모델: 프레임워크는 사전 훈련된 모델을 활용하고 이를 미세 조정하여 많은 훈련 비용과 시간을 절약합니다.
  • 효과 평가: Prompt2Model은 실제 데이터 세트에 대한 모델 테스트 및 평가를 지원하므로 모델을 배포하기 전에 예비 예측 및 성능 평가가 가능하여 모델의 신뢰성이 향상됩니다.

Prompt2Model 프레임워크는 다음과 같은 특징을 가지고 있어 자연어 처리 시스템의 구축 프로세스를 효율적으로 완료할 수 있는 강력한 도구이며, 자동 데이터 수집, 모델 평가, 사용자 상호 작용 인터페이스 등의 고급 기능을 제공합니다.

실험 및 결과

Prompt2Model 시스템의 성능을 평가하기 위해 실험 설계에서 연구원은 세 가지 작업을 선택했습니다.

  • 기계 판독 QA: SQuAD를 실제 평가 데이터 세트로 사용.
  • 일본어 NL-to-Code: MCoNaLa를 실제 평가 데이터 세트로 사용합니다.
  • 시간적 표현 정규화: 시간적 데이터세트를 실제 평가 데이터세트로 사용합니다.

또한 연구진은 비교를 위한 기준 모델로 GPT-3.5-터보를 사용했습니다. 실험 결과는 다음과 같은 결론에 이르렀습니다.

  • 코드 생성 작업을 제외한 다양한 작업에서 Prompt2Model 시스템에 의해 생성된 모델은 생성된 모델 매개변수 규모가 GPT-3.5 터보보다 훨씬 작습니다.
  • 검색된 데이터 세트와 훈련을 위해 생성된 데이터 세트를 혼합하면 실제 데이터 세트 훈련을 직접 사용한 것과 유사한 결과를 얻을 수 있습니다. 이는 Prompt2Model 프레임워크가 수동 주석 비용을 크게 줄일 수 있음을 확인합니다.
  • 데이터 생성기로 생성된 테스트 데이터 세트는 실제 데이터 세트에서 다양한 모델의 성능을 효과적으로 구분할 수 있습니다. 이는 생성된 데이터의 품질이 높으며 모델 학습에 충분한 효과가 있음을 나타냅니다.
  • 일본어를 코드로 변환하는 작업에서 Prompt2Model 시스템은 GPT-3.5-turbo보다 ​​성능이 나쁩니다.

생성된 데이터 세트의 품질이 낮고 사전 훈련된 적절한 모델이 부족하기 때문일 수 있습니다.

요약하자면 Prompt2Model 시스템은 여러 작업에서 고품질 소형 모델을 성공적으로 생성하여 비용을 크게 줄였습니다. 데이터에 수동으로 주석을 달 필요가 있습니다. 그러나 일부 작업에서는 여전히 추가 개선이 필요합니다.

소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!

소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!

요약

Prompt2Model 프레임워크는 자연어 프롬프트를 통해 작업별 모델을 자동으로 구축하는 연구팀이 개발한 혁신적인 기술입니다. 이 기술의 도입으로 맞춤형 자연어 처리 모델 구축의 어려움이 크게 줄어들고 NLP 기술의 적용 범위가 더욱 확장됩니다

검증 실험 결과에 따르면 Prompt2Model 프레임워크로 생성된 모델의 크기는 더 큰 언어 모델에 비해 크게 줄어들었으며 여러 작업에서 GPT-3.5-turbo 및 기타 모델보다 더 나은 성능을 발휘하는 것으로 나타났습니다. 동시에, 이 프레임워크에서 생성된 평가 데이터 세트는 실제 데이터 세트에 대한 다양한 모델의 성능을 평가하는 데 효과적인 것으로 입증되었습니다. 이는 모델의 최종 배포를 안내하는 데 중요한 가치를 제공합니다

Prompt2Model 프레임워크는 업계와 광범위한 사용자에게 특정 요구 사항을 충족하는 NLP 모델을 얻을 수 있는 저렴하고 사용하기 쉬운 방법을 제공합니다. 이는 NLP 기술의 광범위한 적용을 촉진하는 데 큰 의미가 있습니다. 향후 작업은 프레임워크의 성능을 더욱 최적화하는 데 계속 전념할 것입니다.

기사 순서대로 이 기사의 작성자는 다음과 같습니다. 재작성된 내용: 기사 순서에 따라 이 기사의 저자는 다음과 같습니다:

Vijay Viswanathan: http://www.cs.cmu.edu/~vijayv/

Zhao Chenyang: https //zhaochenyang20.github.io/Eren_Chenyang_Zhao/

Amanda Bertsch: https://www.cs.cmu.edu/~abertsch/ 아만다 벨치: https://www.cs.cmu.edu/~abertsch/

Wu Tongshuang: https://www.cs.cmu.edu/~sherryw/

Graham · Newbig: http: //www.phontron.com/

위 내용은 소규모 전문 모델을 빠르게 훈련하세요. 명령 1개, $5, 20분이면 Prompt2Model을 사용해 보세요!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Oracle 데이터베이스 생성 방법 Oracle 데이터베이스를 만드는 방법 Oracle 데이터베이스 생성 방법 Oracle 데이터베이스를 만드는 방법 Apr 11, 2025 pm 02:36 PM

Oracle 데이터베이스를 만들려면 일반적인 방법은 DBCA 그래픽 도구를 사용하는 것입니다. 단계는 다음과 같습니다. 1. DBCA 도구를 사용하여 데이터베이스 이름을 지정하기 위해 DBNAME을 설정하십시오. 2. SySpassword 및 SystemPassword를 강력한 암호로 설정하십시오. 3. Al32UTF8로 문자 세트 및 NationalCharacterset을 세트; 4. 실제 요구에 따라 조정하도록 메모리 크기 및 테이블 스페이스 크기를 설정하십시오. 5. 로그 파일 경로를 지정하십시오. 고급 메소드는 SQL 명령을 사용하여 수동으로 생성되지만 더 복잡하고 오류가 발생하기 쉽습니다. 비밀번호 강도, 문자 세트 선택, 테이블 스페이스 크기 및 메모리에주의하십시오.

Oracle 데이터베이스 작성 방법 Oracle 데이터베이스 작성 방법 Oracle 데이터베이스 작성 방법 Oracle 데이터베이스 작성 방법 Apr 11, 2025 pm 02:33 PM

Oracle 데이터베이스를 만드는 것은 쉽지 않으므로 기본 메커니즘을 이해해야합니다. 1. 데이터베이스 및 Oracle DBMS의 개념을 이해해야합니다. 2. SID, CDB (컨테이너 데이터베이스), PDB (Pluggable Database)와 같은 핵심 개념을 마스터합니다. 3. SQL*Plus를 사용하여 CDB를 생성 한 다음 PDB를 만들려면 크기, 데이터 파일 수 및 경로와 같은 매개 변수를 지정해야합니다. 4. 고급 응용 프로그램은 문자 세트, 메모리 및 기타 매개 변수를 조정하고 성능 튜닝을 수행해야합니다. 5. 디스크 공간, 권한 및 매개 변수 설정에주의를 기울이고 데이터베이스 성능을 지속적으로 모니터링하고 최적화하십시오. 그것을 능숙하게 마스터 함으로써만 지속적인 연습이 필요합니다. Oracle 데이터베이스의 생성 및 관리를 진정으로 이해할 수 있습니다.

Oracle Database 문을 작성하는 방법 Oracle Database 문을 작성하는 방법 Apr 11, 2025 pm 02:42 PM

Oracle SQL 문의 핵심은 다양한 조항의 유연한 적용뿐만 아니라 선택, 삽입, 업데이트 및 삭제입니다. 인덱스 최적화와 같은 진술의 실행 메커니즘을 이해하는 것이 중요합니다. 고급 사용에는 하위 쿼리, 연결 쿼리, 분석 기능 및 PL/SQL이 포함됩니다. 일반적인 오류에는 구문 오류, 성능 문제 및 데이터 일관성 문제가 포함됩니다. 성능 최적화 모범 사례에는 적절한 인덱스를 사용하고 선택 *을 피하고 조항을 최적화하고 바운드 변수를 사용하는 것이 포함됩니다. Oracle SQL을 마스터하려면 코드 쓰기, 디버깅, 사고 및 기본 메커니즘 이해를 포함한 연습이 필요합니다.

MySQL 데이터 테이블 필드 작동 안내서를 추가, 수정 및 삭제하는 방법 MySQL 데이터 테이블 필드 작동 안내서를 추가, 수정 및 삭제하는 방법 Apr 11, 2025 pm 05:42 PM

MySQL의 현장 작동 안내서 : 필드를 추가, 수정 및 삭제합니다. 필드 추가 : Alter Table_Name ADD CORMEN_NAME DATA _TYPE [NOT NOT NORN NOT] [DEFAULT DEFAULT_VALUE] [기본 키] [기본 키] [AUTO_INCREMENT] 수정 필드 : ALTER TABLE_NAME COLUME_NAME DATY_TYPE [NOT NOT NOT NOT NOT DEFAULT_VALUE] [기본 키]

Oracle 데이터베이스 테이블의 무결성 제약 조건은 무엇입니까? Oracle 데이터베이스 테이블의 무결성 제약 조건은 무엇입니까? Apr 11, 2025 pm 03:42 PM

Oracle 데이터베이스의 무결성 제약 조건은 다음을 포함하여 데이터 정확도를 보장 할 수 있습니다. NULL : NULL 값은 금지됩니다. 고유 : 독창성을 보장하고 단일 널 값을 허용합니다. 기본 키 : 기본 키 제약 조건, 고유 한 강화 및 널 값을 금지합니다. 외국 키 : 테이블 간의 관계 유지, 외국 키는 기본 테이블 기본 키를 나타냅니다. 점검 : 조건에 따라 열 값을 제한합니다.

MySQL 데이터베이스의 중첩 쿼리 인스턴스에 대한 자세한 설명 MySQL 데이터베이스의 중첩 쿼리 인스턴스에 대한 자세한 설명 Apr 11, 2025 pm 05:48 PM

중첩 쿼리는 한 쿼리에 다른 쿼리를 포함시키는 방법입니다. 주로 복잡한 조건을 충족하고 여러 테이블을 연관시키고 요약 값 또는 통계 정보를 계산하는 데이터를 검색하는 데 사용됩니다. 예로는 평균 임금 이상의 직원 찾기, 특정 범주에 대한 주문 찾기 및 각 제품의 총 주문량 계산이 있습니다. 중첩 쿼리를 작성할 때는 다음을 따라야합니다. 하위 쿼리를 작성하고 결과를 외부 쿼리 (별명 또는 클로시로 참조)에 작성하고 쿼리 성능 (색인 사용)을 최적화하십시오.

오라클은 무엇을합니까? 오라클은 무엇을합니까? Apr 11, 2025 pm 06:06 PM

Oracle은 세계 최대의 데이터베이스 관리 시스템 (DBMS) 소프트웨어 회사입니다. 주요 제품에는 다음과 같은 기능이 포함됩니다. 관계형 데이터베이스 관리 시스템 (Oracle Database) 개발 도구 (Oracle Apex, Oracle Visual Builder) Middleware (Oracle Weblogic Server, Oracle SOA Suite) 클라우드 서비스 (Oracle Cloud Infrastructure) 분석 및 비즈니스 인텔리전스 (Oracle Analytics Cloud, Oracle Essbase) 블록카 인 (Oracle Blockchain PLA

데비안 아파치 로그 형식을 구성하는 방법 데비안 아파치 로그 형식을 구성하는 방법 Apr 12, 2025 pm 11:30 PM

이 기사에서는 데비안 시스템에서 Apache의 로그 형식을 사용자 정의하는 방법에 대해 설명합니다. 다음 단계는 구성 프로세스를 안내합니다. 1 단계 : Apache 구성 파일 액세스 Debian 시스템의 기본 Apache 구성 파일은 일반적으로 /etc/apache2/apache2.conf 또는 /etc/apache2/httpd.conf에 있습니다. 다음 명령을 사용하여 루트 권한으로 구성 파일을 엽니 다.

See all articles