목차
.
프로젝트 홈페이지 링크: https://xiamengzhou.github.io/seared-llama/
기술 주변기기 일체 포함 Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 '알파카 털깎기' 열풍을 일으켰습니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 '알파카 털깎기' 열풍을 일으켰습니다.

Oct 12, 2023 pm 02:29 PM
ai 기차

SOTA를 얻기 위해 3%의 계산량5%의 비용만 사용하여 1B-3B 규모의 오픈소스 대형 모델을 장악하고 있습니다.

이 결과는 프린스턴 팀의 Chen Danqi에서 나온 것이며 LLM-Shearing대형 모델 가지치기 방법이라고 합니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

Alpaca LLaMA 2 7B를 기반으로 1.3B 및 3B 가지치기 Sheared-LLama 모델은 방향 구조 가지치기를 통해 얻어집니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

다운스트림 작업 평가에서 동일한 규모의 이전 모델을 능가하려면 다시 작성해야 합니다

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

제1저자인 Xia Mengzhou는 "사전 훈련보다 훨씬 비용 효율적입니다. 기스로부터."

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

또한 이 논문에서는 정리된 Sheared-LLaMA 출력의 예를 제공하여 1.3B와 2.7B의 크기에도 불구하고 이미 일관되고 풍부한 응답을 생성할 수 있음을 보여줍니다.

"반도체 산업 분석가의 역할 수행"이라는 동일한 작업에 대해 버전 2.7B의 답변 구조가 더욱 명확해졌습니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

팀에서는 현재 Llama 2 7B 버전만 가지치기 실험에 사용되었지만 방법 을 다른 모델 아키텍처 로 확장할 수 있으며 모든 규모로 확장

할 수도 있다고 밝혔습니다.

가지치기 후의 추가 이점은 지속적인 사전 학습을 위해 고품질 데이터 세트를 선택할 수 있다는 것입니다.Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

일부 개발자는 불과 6개월 전만 해도 거의 모든 사람들이 65B 미만의 모델에는 실용적인 용도가 없다고 생각했다고 말했습니다.

이대로라면 1B-3B 모델도 지금은 아니더라도 조만간 큰 가치를 지니게 될 것이라고 확신합니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

가지치기를 제한된 최적화로 처리LLM-전단, 특히 대규모 모델을 지정된 대상 구조로 가지치기하는 일종의 방향 구조 가지치기

입니다.

기존 가지치기 방법은 일부 구조가 삭제되어 표현력에 영향을 미치기 때문에 모델 성능 저하를 일으킬 수 있습니다.

가지치기를 제한된 최적화 문제로 취급하여 새로운 방법을 제안합니다. 가지치기 마스크 행렬을 학습하여 지정된 구조와 일치하는 하위 네트워크를 검색하고 성능 극대화를 목표로 합니다Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

다음으로 가지치기 모델을 계속해서 사전 훈련하고 성능 손실이 발생한 정도까지 가지치기를 복원합니다.

이 단계에서 팀은 가지치기된 모델과 처음부터 훈련된 모델이 데이터 세트마다 손실 감소율이 다르기 때문에 데이터 사용 효율성이 낮은 문제가 있음을 발견했습니다. 이를 위해 팀은 다양한 도메인 데이터에 대한 모델의 손실 감소율에 따라 각 도메인의 데이터 비율을 동적으로 조정하여 데이터 사용 효율성을 향상시키는 Dynamic Batch Loading

(Dynamic Batch Loading)

을 제안했습니다. Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

연구에 따르면 가지치기 모델은 처음부터 훈련한 동일한 크기의 모델에 비해 초기 성능이 낮지만 지속적인 사전 훈련을 통해 빠르게 개선되어 결국 능가할 수 있습니다.

🎜이는 강력한 기본 모델 분기에서 가지치기가 가능함을 보여줍니다. 이는 지속적인 사전 훈련을 위한 더 나은 초기화 조건을 제공할 수 있습니다. 🎜종이의 저자는 계속해서 업데이트하고 와서 자르고 자르고, 프린스턴 박사 과정 학생들입니다. 조교수

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.Chen Dan琦

.

Xia Mengzhou는 푸단대학교에서 학사 학위를, CMU에서 석사 학위를 받았습니다. Gao Tianyu는 Tsinghua University를 졸업한 학부생입니다. 그는 2019년 Tsinghua Special Prize를 수상했습니다.둘 다 Chen Danqi의 학생이고 Chen Danqi는 현재 Princeton University의 조교수이자 Princeton Natural 회원입니다. 언어 처리 그룹 공동 리더 Chen Danqi는 최근 개인 홈페이지에 연구 방향을 업데이트했습니다. "이 기간은 주로 대규모 모델 개발에 중점을 두고 있으며 연구 주제는 다음과 같습니다. "진위성, 적응성, 해석 가능성 및 신뢰성을 향상시키기 위해 검색이 차세대 모델에서 어떻게 중요한 역할을 할 수 있는지. 대규모 모델의 저렴한 교육 및 배포, 향상된 교육 방법, 데이터 관리, 모델 압축 및 다운스트림 작업 적응 최적화. 현재 대형 모델의 기능과 한계에 대한 이해를 경험적으로나 이론적으로 향상시키는 작업에도 관심이 있습니다.

Sheared-Llama는 이미 Hugging Face에서 만나보실 수 있습니다

오픈소스 라이브러리를 계속 업데이트할 예정이라고 하더군요

    더 큰 모델이 나오면 하나씩 잘라서 계속해서 고성능 소형 모델 출시 .
  • 한 가지 더
지금 큰 모델들은 정말 너무 곱슬이라고 말씀드리고 싶습니다.

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.Mengzhou Xia는 방금 논문을 작성할 때 SOTA 기술이 사용되었다고 정정을 발표했지만 논문이 완성된 후 최신 Stable-LM-3B 기술을 능가했습니다

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

논문 주소: https: / /arxiv.org/abs/2310.06694

껴안는 얼굴: https://huggingface.co/princeton-nlp

Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 알파카 털깎기 열풍을 일으켰습니다.

프로젝트 홈페이지 링크: https://xiamengzhou.github.io/seared-llama/

위 내용은 Chen Danqi 팀의 혁신적인 작업: 5% 비용으로 SOTA를 획득하여 '알파카 털깎기' 열풍을 일으켰습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Debian Readdir의 파일 정렬을 구현하는 방법 Debian Readdir의 파일 정렬을 구현하는 방법 Apr 13, 2025 am 09:06 AM

Debian Systems에서 readDIR 함수는 디렉토리 내용을 읽는 데 사용되지만 반환하는 순서는 사전 정의되지 않습니다. 디렉토리에 파일을 정렬하려면 먼저 모든 파일을 읽은 다음 QSORT 기능을 사용하여 정렬해야합니다. 다음 코드는 데비안 시스템에서 readdir 및 qsort를 사용하여 디렉토리 파일을 정렬하는 방법을 보여줍니다.#포함#포함#포함#포함#포함 // QsortIntCompare (constvoid*a, constVoid*b) {returnStrcmp (*(*)

데비안 아파치 로그 레벨을 설정하는 방법 데비안 아파치 로그 레벨을 설정하는 방법 Apr 13, 2025 am 08:33 AM

이 기사에서는 데비안 시스템에서 Apacheweb 서버의 로깅 레벨을 조정하는 방법에 대해 설명합니다. 구성 파일을 수정하면 Apache가 기록한 로그 정보 수준을 제어 할 수 있습니다. 메소드 1 : 구성 파일을 찾으려면 기본 구성 파일을 수정합니다. 구성 파일 : APACHE2.X의 구성 파일은 일반적으로/etc/apache2/디렉토리에 있습니다. 파일 이름은 설치 방법에 따라 apache2.conf 또는 httpd.conf 일 수 있습니다. 구성 파일 편집 : 텍스트 편집기 (예 : Nano)를 사용하여 루트 권한이있는 구성 파일 열기 : sudonano/etc/apache2/apache2.conf

Debian Readdir의 성능을 최적화하는 방법 Debian Readdir의 성능을 최적화하는 방법 Apr 13, 2025 am 08:48 AM

Debian Systems에서 ReadDir 시스템 호출은 디렉토리 내용을 읽는 데 사용됩니다. 성능이 좋지 않은 경우 다음과 같은 최적화 전략을 시도해보십시오. 디렉토리 파일 수를 단순화하십시오. 대규모 디렉토리를 가능한 한 여러 소규모 디렉토리로 나누어 읽기마다 처리 된 항목 수를 줄입니다. 디렉토리 컨텐츠 캐싱 활성화 : 캐시 메커니즘을 구축하고 정기적으로 캐시를 업데이트하거나 디렉토리 컨텐츠가 변경 될 때 캐시를 업데이트하며 readDir로 자주 호출을 줄입니다. 메모리 캐시 (예 : Memcached 또는 Redis) 또는 로컬 캐시 (예 : 파일 또는 데이터베이스)를 고려할 수 있습니다. 효율적인 데이터 구조 채택 : 디렉토리 트래버스를 직접 구현하는 경우 디렉토리 정보를 저장하고 액세스하기 위해보다 효율적인 데이터 구조 (예 : 선형 검색 대신 해시 테이블)를 선택하십시오.

데비안 메일 서버 방화벽 구성 팁 데비안 메일 서버 방화벽 구성 팁 Apr 13, 2025 am 11:42 AM

데비안 메일 서버의 방화벽 구성은 서버 보안을 보장하는 데 중요한 단계입니다. 다음은 iptables 및 방화구 사용을 포함하여 일반적으로 사용되는 여러 방화벽 구성 방법입니다. iptables를 사용하여 iptables를 설치하도록 방화벽을 구성하십시오 (아직 설치되지 않은 경우) : sudoapt-getupdatesudoapt-getinstalliptablesview 현재 iptables 규칙 : sudoiptables-l configuration

데비안 메일 서버 SSL 인증서 설치 방법 데비안 메일 서버 SSL 인증서 설치 방법 Apr 13, 2025 am 11:39 AM

Debian Mail 서버에 SSL 인증서를 설치하는 단계는 다음과 같습니다. 1. OpenSSL 툴킷을 먼저 설치하십시오. 먼저 OpenSSL 툴킷이 이미 시스템에 설치되어 있는지 확인하십시오. 설치되지 않은 경우 다음 명령을 사용하여 설치할 수 있습니다. 개인 키 및 인증서 요청 생성 다음에 다음, OpenSSL을 사용하여 2048 비트 RSA 개인 키 및 인증서 요청 (CSR)을 생성합니다.

Debian Readdir가 다른 도구와 통합하는 방법 Debian Readdir가 다른 도구와 통합하는 방법 Apr 13, 2025 am 09:42 AM

데비안 시스템의 readdir 함수는 디렉토리 컨텐츠를 읽는 데 사용되는 시스템 호출이며 종종 C 프로그래밍에 사용됩니다. 이 기사에서는 ReadDir를 다른 도구와 통합하여 기능을 향상시키는 방법을 설명합니다. 방법 1 : C 언어 프로그램을 파이프 라인과 결합하고 먼저 C 프로그램을 작성하여 readDir 함수를 호출하고 결과를 출력하십시오.#포함#포함#포함#포함#includinTmain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

데비안을 오류하는 방법은 중간 중간의 공격을 방해합니다 데비안을 오류하는 방법은 중간 중간의 공격을 방해합니다 Apr 13, 2025 am 10:30 AM

Debian Systems에서 OpenSSL은 암호화, 암호 해독 및 인증서 관리를위한 중요한 라이브러리입니다. MITM (Man-in-the-Middle Attack)을 방지하려면 다음 측정을 수행 할 수 있습니다. HTTPS 사용 : 모든 네트워크 요청이 HTTP 대신 HTTPS 프로토콜을 사용하도록하십시오. HTTPS는 TLS (Transport Layer Security Protocol)를 사용하여 통신 데이터를 암호화하여 전송 중에 데이터가 도난 당하거나 변조되지 않도록합니다. 서버 인증서 확인 : 클라이언트의 서버 인증서를 수동으로 확인하여 신뢰할 수 있는지 확인하십시오. 서버는 대의원 메소드를 통해 수동으로 확인할 수 있습니다.

데비안 syslog를 배우는 방법 데비안 syslog를 배우는 방법 Apr 13, 2025 am 11:51 AM

이 안내서는 데비안 시스템에서 syslog를 사용하는 방법을 배우도록 안내합니다. Syslog는 로깅 시스템 및 응용 프로그램 로그 메시지를위한 Linux 시스템의 핵심 서비스입니다. 관리자가 시스템 활동을 모니터링하고 분석하여 문제를 신속하게 식별하고 해결하는 데 도움이됩니다. 1. syslog에 대한 기본 지식 syslog의 핵심 기능에는 다음이 포함됩니다. 로그 메시지 중앙 수집 및 관리; 다중 로그 출력 형식 및 대상 위치 (예 : 파일 또는 네트워크) 지원; 실시간 로그보기 및 필터링 기능 제공. 2. Syslog 설치 및 구성 (RSYSLOG 사용) Debian 시스템은 기본적으로 RSYSLOG를 사용합니다. 다음 명령으로 설치할 수 있습니다 : sudoaptupdatesud

See all articles