Open LLM 목록이 다시 새로워졌고 Llama 2보다 더 강한 'Platypus'가 여기에 있습니다.-일체 포함-php.cn

Open-Platypus 데이터세트

오염 문제

미세 조정 및 병합

결과

집

기술 주변기기

일체 포함

Open LLM 목록이 다시 새로워졌고 Llama 2보다 더 강한 'Platypus'가 여기에 있습니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 17, 2023 pm 03:09 PM

ai 모델

OpenAI의 GPT-3.5, GPT-4 등 폐쇄형 모델의 지배력에 도전하기 위해 LLaMa, Falcon 등 일련의 오픈소스 모델이 등장하고 있습니다. 최근 Meta AI는 오픈소스 분야에서 가장 강력한 모델로 알려진 LLaMa-2를 출시했으며, 많은 연구자들도 이를 기반으로 자체 모델을 구축했습니다. 예를 들어 StabilityAI는 Orca 스타일 데이터 세트를 사용하여 Llama2 70B 모델을 미세 조정하고 StableBeluga2를 개발했으며 Huggingface의 Open LLM 순위에서도 좋은 결과를 얻었습니다

최근 Open LLM 순위가 변경되었습니다. Platypus(Platypus) 모델 성공적으로 1위를 차지했습니다

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

저자는 보스턴 대학교 출신이며 PEFT, LoRA 및 Open-Platypus 데이터세트를 사용하여 Llama 2를 기반으로 오리너구리를 미세 조정하고 최적화했습니다.

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

저자는 오리너구리를 소개합니다 논문에 자세히 나와 있습니다

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

이 논문은 https://arxiv.org/abs/2308.07317

다음은 이 논문의 주요 기여입니다:

Open-Platypus는 선별된 공개 텍스트 데이터세트의 하위 집합으로 구성된 소규모 데이터세트입니다. 이 데이터 세트는 LLM의 STEM 및 논리 지식 향상에 중점을 둔 11개의 오픈 소스 데이터 세트로 구성됩니다. 주로 사람이 디자인한 질문으로 구성되어 있으며 LLM에서 생성된 질문은 10%에 불과합니다. Open-Platypus의 가장 큰 장점은 규모와 품질로, 짧은 시간에 매우 높은 성능을 구현하고, 적은 시간과 미세 조정 비용으로 가능합니다. 특히 25,000개의 문제를 사용하여 13B 모델을 훈련하는 데는 단일 A100 GPU에서 단 5시간이 소요됩니다.
에서는 유사성 제거 프로세스를 설명하고 데이터세트 크기를 줄이며 데이터 중복성을 줄입니다.
중요한 LLM 테스트 세트에 포함된 데이터로 인해 공개 LLM 교육 세트가 오염되는 현상에 대한 자세한 분석과 이러한 숨겨진 위험을 피하기 위한 작성자의 교육 데이터 필터링 프로세스를 소개합니다.
전문적으로 미세 조정된 LoRA 모듈을 선택하고 통합하는 과정을 설명합니다.

Open-Platypus 데이터세트

저자는 현재 Hugging Face

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

오염 문제

에 Open-Platypus 데이터세트를 출시했습니다. 벤치마킹 문제가 교육에 유출되지 않도록 방지 설정되면 우리의 방법은 먼저 이 문제를 방지하여 결과가 메모리에 의해 편향되지 않도록 하는 것을 고려합니다. 정확성을 위해 노력하는 동시에 저자는 질문이 다양한 방식으로 질문될 수 있고 일반적인 도메인 지식의 영향을 받기 때문에 질문을 다시 말씀해 주세요 표시에 유연성이 필요하다는 것을 알고 있습니다. 잠재적인 누출 문제를 관리하기 위해 저자는 Open-Platypus의 벤치마크 문제의 코사인 임베딩과 80% 이상의 유사성을 갖는 문제를 수동으로 필터링하기 위한 휴리스틱을 신중하게 설계했습니다. 그들은 잠재적인 누출 문제를 세 가지 범주로 나누었습니다. (1) 질문을 다시 말해주세요. 이 영역은 회색 톤의 문제를 나타냅니다. (3) 유사하지만 동일하지 않은 문제입니다. 조심하기 위해 훈련 세트에서 이러한 모든 질문을 제외했습니다.

다시 말씀해 주세요.

이 텍스트는 테스트 질문 세트의 내용을 약간만 수정하여 거의 정확하게 복제합니다. 단어를 수정하거나 재배열합니다. 위 표의 누출 횟수를 기준으로 저자는 이것이 오염에 해당하는 유일한 범주라고 믿습니다. 다음은 구체적인 예입니다.

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

재설명: 이 부분은 회색으로 변합니다

다음 질문을 재설명이라고 합니다. 이 영역은 회색 음영을 띠고 상식적이지 않은 문제를 포함합니다. 저자는 이러한 문제에 대한 최종 판단을 오픈 소스 커뮤니티에 맡기면서도 이러한 문제에는 전문 지식이 필요한 경우가 많다고 주장합니다. 이러한 유형의 질문에는 지침은 완전히 동일하지만 답변이 동의어인 질문이 포함된다는 점에 유의해야 합니다.

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

비슷하지만 정확히 동일하지는 않음

이러한 질문은 높은 수준의 유사성을 가지고 있습니다. 그러나 질문 간의 미묘한 차이로 인해 답변에 상당한 차이가 있습니다.

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

미세 조정 및 병합

데이터 세트가 개선된 후 저자는 LoRA(낮은 순위 근사) 학습과 PEFT(매개변수 효율적 미세 조정) 라이브러리라는 두 가지 방법에 중점을 둡니다. LoRA는 완전 미세 조정과 달리 사전 훈련된 모델의 가중치를 유지하고 변환기 계층에 통합하기 위해 순위 분해 행렬을 사용하므로 훈련 가능한 매개변수를 줄이고 훈련 시간과 비용을 절약합니다. 처음에는 미세 조정이 주로 v_proj, q_proj, k_proj 및 o_proj와 같은 Attention 모듈에 중점을 두었습니다. 이후 He 등의 제안에 따라 Gate_proj, down_proj 및 up_proj 모듈로 확장되었습니다. 훈련 가능한 매개변수가 전체 매개변수의 0.1% 미만이 아닌 이상 이러한 모듈은 더 나은 성능을 발휘합니다. 저자는 13B와 70B 모델 모두에 이 방법을 채택했으며, 그 결과 학습 가능한 매개변수는 각각 0.27%와 0.2%였습니다. 유일한 차이점은 이들 모델의 초기 학습률입니다

결과

2023년 8월 10일 Hugging Face Open LLM 순위 데이터에 따르면 저자는 Platypus를 다른 SOTA 모델과 비교한 결과 Platypus2-70Binstruct를 발견했습니다. 변경 모델이 좋은 성능을 발휘하여 평균 73.13점으로 1위

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

Stable-Platypus2-13B 모델이 130억개 매개변수 모델 중 평균 63.96점으로 눈에 띄어 주목할 만합니다

Open LLM榜单再次刷新，比Llama 2更强的「鸭嘴兽」来了

Limitations

Platypus는 LLaMa-2의 미세 조정된 확장으로서 기본 모델의 많은 제약 조건을 유지하고 LLaMa-2의 정적 지식 기반을 공유하여 특정 과제를 도입합니다. 또한, 특히 명확하지 않은 프롬프트의 경우 부정확하거나 부적절한 콘텐츠가 생성될 위험이 있습니다. 때때로 편파적이거나 유해한 콘텐츠를 생성합니다. 저자는 이러한 문제를 최소화하기 위한 노력을 인정하지만 특히 영어가 아닌 언어에서 응용 프로그램의 보안 테스트가 계속되고 있음을 인정합니다. 오리너구리는 기본 도메인 외부에서 몇 가지 제한 사항이 있을 수 있으므로 사용자는 주의해서 진행하고 최적의 성능을 위해 추가적인 미세 조정을 고려해야 합니다. 사용자는 오리너구리의 훈련 데이터가 다른 벤치마크 테스트 세트와 겹치지 않는지 확인해야 합니다. 저자는 데이터 오염 문제에 대해 매우 주의를 기울이고 있으며, 오염된 데이터 세트에 대해 훈련된 모델과 모델을 병합하는 것을 피합니다. 정리된 훈련 데이터에는 오염이 없는 것으로 확인되었으나 일부 문제가 간과되었을 가능성도 배제할 수 없습니다. 이러한 제한 사항에 대해 자세히 알아보려면 논문의 제한 사항 섹션을 참조하세요.

위 내용은 Open LLM 목록이 다시 새로워졌고 Llama 2보다 더 강한 'Platypus'가 여기에 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7491

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

phpmyadmin은 데이터 테이블을 만듭니다 Apr 10, 2025 pm 11:00 PM

phpmyadmin을 사용하여 데이터 테이블을 만들려면 다음 단계가 필수적입니다. 데이터베이스에 연결하고 새 탭을 클릭하십시오. 테이블의 이름을 지정하고 저장 엔진을 선택하십시오 (InnoDB 권장). 열 이름, 데이터 유형, NULL 값 허용 여부 및 기타 속성을 포함하여 열 추가 버튼을 클릭하여 열 디테일을 추가하십시오. 기본 키로 하나 이상의 열을 선택하십시오. 저장 버튼을 클릭하여 테이블과 열을 만듭니다.

Oracle 데이터베이스 작성 방법 Oracle 데이터베이스 작성 방법 Apr 11, 2025 pm 02:33 PM

Oracle 데이터베이스를 만드는 것은 쉽지 않으므로 기본 메커니즘을 이해해야합니다. 1. 데이터베이스 및 Oracle DBMS의 개념을 이해해야합니다. 2. SID, CDB (컨테이너 데이터베이스), PDB (Pluggable Database)와 같은 핵심 개념을 마스터합니다. 3. SQL*Plus를 사용하여 CDB를 생성 한 다음 PDB를 만들려면 크기, 데이터 파일 수 및 경로와 같은 매개 변수를 지정해야합니다. 4. 고급 응용 프로그램은 문자 세트, 메모리 및 기타 매개 변수를 조정하고 성능 튜닝을 수행해야합니다. 5. 디스크 공간, 권한 및 매개 변수 설정에주의를 기울이고 데이터베이스 성능을 지속적으로 모니터링하고 최적화하십시오. 그것을 능숙하게 마스터 함으로써만 지속적인 연습이 필요합니다. Oracle 데이터베이스의 생성 및 관리를 진정으로 이해할 수 있습니다.

Oracle 데이터베이스 생성 방법 Oracle 데이터베이스를 만드는 방법 Apr 11, 2025 pm 02:36 PM

Oracle 데이터베이스를 만들려면 일반적인 방법은 DBCA 그래픽 도구를 사용하는 것입니다. 단계는 다음과 같습니다. 1. DBCA 도구를 사용하여 데이터베이스 이름을 지정하기 위해 DBNAME을 설정하십시오. 2. SySpassword 및 SystemPassword를 강력한 암호로 설정하십시오. 3. Al32UTF8로 문자 세트 및 NationalCharacterset을 세트; 4. 실제 요구에 따라 조정하도록 메모리 크기 및 테이블 스페이스 크기를 설정하십시오. 5. 로그 파일 경로를 지정하십시오. 고급 메소드는 SQL 명령을 사용하여 수동으로 생성되지만 더 복잡하고 오류가 발생하기 쉽습니다. 비밀번호 강도, 문자 세트 선택, 테이블 스페이스 크기 및 메모리에주의하십시오.

Oracle Database 문을 작성하는 방법 Apr 11, 2025 pm 02:42 PM

Oracle SQL 문의 핵심은 다양한 조항의 유연한 적용뿐만 아니라 선택, 삽입, 업데이트 및 삭제입니다. 인덱스 최적화와 같은 진술의 실행 메커니즘을 이해하는 것이 중요합니다. 고급 사용에는 하위 쿼리, 연결 쿼리, 분석 기능 및 PL/SQL이 포함됩니다. 일반적인 오류에는 구문 오류, 성능 문제 및 데이터 일관성 문제가 포함됩니다. 성능 최적화 모범 사례에는 적절한 인덱스를 사용하고 선택 *을 피하고 조항을 최적화하고 바운드 변수를 사용하는 것이 포함됩니다. Oracle SQL을 마스터하려면 코드 쓰기, 디버깅, 사고 및 기본 메커니즘 이해를 포함한 연습이 필요합니다.

MySQL 데이터 테이블 필드 작동 안내서를 추가, 수정 및 삭제하는 방법 Apr 11, 2025 pm 05:42 PM

MySQL의 현장 작동 안내서 : 필드를 추가, 수정 및 삭제합니다. 필드 추가 : Alter Table_Name ADD CORMEN_NAME DATA _TYPE [NOT NOT NORN NOT] [DEFAULT DEFAULT_VALUE] [기본 키] [기본 키] [AUTO_INCREMENT] 수정 필드 : ALTER TABLE_NAME COLUME_NAME DATY_TYPE [NOT NOT NOT NOT NOT DEFAULT_VALUE] [기본 키]

Oracle 데이터베이스 테이블의 무결성 제약 조건은 무엇입니까? Apr 11, 2025 pm 03:42 PM

Oracle 데이터베이스의 무결성 제약 조건은 다음을 포함하여 데이터 정확도를 보장 할 수 있습니다. NULL : NULL 값은 금지됩니다. 고유 : 독창성을 보장하고 단일 널 값을 허용합니다. 기본 키 : 기본 키 제약 조건, 고유 한 강화 및 널 값을 금지합니다. 외국 키 : 테이블 간의 관계 유지, 외국 키는 기본 테이블 기본 키를 나타냅니다. 점검 : 조건에 따라 열 값을 제한합니다.

MySQL 데이터베이스의 중첩 쿼리 인스턴스에 대한 자세한 설명 Apr 11, 2025 pm 05:48 PM

중첩 쿼리는 한 쿼리에 다른 쿼리를 포함시키는 방법입니다. 주로 복잡한 조건을 충족하고 여러 테이블을 연관시키고 요약 값 또는 통계 정보를 계산하는 데이터를 검색하는 데 사용됩니다. 예로는 평균 임금 이상의 직원 찾기, 특정 범주에 대한 주문 찾기 및 각 제품의 총 주문량 계산이 있습니다. 중첩 쿼리를 작성할 때는 다음을 따라야합니다. 하위 쿼리를 작성하고 결과를 외부 쿼리 (별명 또는 클로시로 참조)에 작성하고 쿼리 성능 (색인 사용)을 최적화하십시오.

오라클은 무엇을합니까? Apr 11, 2025 pm 06:06 PM

Oracle은 세계 최대의 데이터베이스 관리 시스템 (DBMS) 소프트웨어 회사입니다. 주요 제품에는 다음과 같은 기능이 포함됩니다. 관계형 데이터베이스 관리 시스템 (Oracle Database) 개발 도구 (Oracle Apex, Oracle Visual Builder) Middleware (Oracle Weblogic Server, Oracle SOA Suite) 클라우드 서비스 (Oracle Cloud Infrastructure) 분석 및 비즈니스 인텔리전스 (Oracle Analytics Cloud, Oracle Essbase) 블록카 인 (Oracle Blockchain PLA

See all articles

Open LLM 목록이 다시 새로워졌고 Llama 2보다 더 강한 'Platypus'가 여기에 있습니다.

Open-Platypus 데이터세트

오염 문제

미세 조정 및 병합

결과

Limitations

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제