ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.-일체 포함-php.cn

ChatGPT의 "오픈 소스 방식"으로 LLaMA를 교육합니다

집

기술 주변기기

일체 포함

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

PHPz

Apr 13, 2023 pm 05:13 PM

암호 기차 lama

메타 모델을 기반으로 한 ChatGPT의 경량 버전이 출시되었습니다.

Meta가 LLaMA 출시를 발표한 지 불과 3일 만에 업계에서는 이를 ChatGPT로 전환하는 오픈 소스 교육 방법을 이미 개발했는데, 이는 ChatGPT 교육보다 최대 15배 빠르다고 합니다.

LLaMA는 Meta가 출시한 초고속 초소형 GPT-3입니다. 매개변수 수는 후자의 10%에 불과하며, 실행하는 데에는 단일 GPU만 필요합니다.

ChatGPT로 변환하는 방법은 ChatLLaMA라고 하는데, 이는 RLHF(인간 피드백 기반 강화 학습)를 기반으로 학습되었으며 인터넷에서 빠르게 인기를 얻었습니다.

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

그럼 Meta의 ChatGPT 오픈소스 버전이 정말 나오나요?

잠깐만요. 상황이 그렇게 간단하지 않습니다.

ChatGPT의 "오픈 소스 방식"으로 LLaMA를 교육합니다

ChatLLaMA 프로젝트 홈페이지를 클릭하면 실제로 4가지 부분, 즉

DeepSpeed, RLHF 방식, LLaMA 및 LangChain 에이전트를 기반으로 생성된 데이터 세트가 통합되어 있는 것을 확인할 수 있습니다.

그중 DeepSpeed는 대형 모델 훈련 능력을 향상시키는 데 사용되는 Zero라는 기존 최적화 기술이 포함된 오픈 소스 딥 러닝 훈련 최적화 라이브러리입니다. 구체적으로는 모델의 훈련 속도 향상, 비용 절감을 돕는 것을 말합니다. , 모델 가용성 개선 등

RLHF는 보상 모델을 사용하여 사전 훈련된 모델을 미세 조정합니다. 보상 모델은 먼저 여러 모델을 사용하여 질문과 답변을 생성한 다음 질문과 답변을 수동으로 정렬하여 점수를 매기는 방법을 학습합니다. 그런 다음 보상 학습을 기반으로 모델에서 생성된 답변을 점수화하고 향상시킵니다. 강화학습을 통해 모델의 능력을 향상시킵니다.

LangChain은 다양한 대형 언어 모델을 통합하고 다른 지식 소스 또는 컴퓨팅 능력과 결합된 실용적인 응용 프로그램을 만들기를 희망하는 대형 언어 모델 응용 프로그램 개발 라이브러리입니다. LangChain 에이전트는 GPT-3 사고의 전체 프로세스를 사고 체인처럼 공개하고 작업을 기록합니다.

이때 가장 중요한 것은 여전히 LLaMA의 모델 무게라는 것을 알게 될 것입니다. 그거 어디서 났어?

메타에 가서 직접 신청하세요. ChatLLaMA에서는 제공하지 않습니다. (Meta는 오픈 소스 LLaMA를 주장하지만 여전히 신청해야 합니다.)

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

따라서 본질적으로 ChatLLaMA는 오픈 소스 ChatGPT 프로젝트가 아니라 LLaMA를 기반으로 한 교육 방법일 뿐입니다. 라이브러리에 통합된 여러 프로젝트는 원래 모두였습니다. 오픈 소스입니다.

사실 ChatLLaMA는 Meta가 만든 것이 아니라 Nebuly AI라는 AI 스타트업 회사에서 만든 것입니다.

Nebuly AI는 일련의 플러그 앤 플레이 최적화 모듈을 통합하여 AI 시스템 성능을 향상시키는 Nebullvm이라는 오픈 소스 라이브러리를 만들었습니다.

예를 들어 DeepMind의 오픈 소스 AlphaTensor 알고리즘을 기반으로 하는 OpenAlphaTensor, 하드웨어를 자동으로 감지하고 가속하는 최적화 모듈을 포함하여 현재 Nebullvm에 포함된 일부 모듈이 있습니다...

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

ChatLLaMA도 이 모듈 시리즈에 속합니다. 그러나 오픈소스 라이선스는 상업적으로 이용 가능하지 않다는 점에 유의해야 합니다.

그래서 "국내 자체 개발한 ChatGPT"를 직접 사용하고 싶다면 그렇게 간단하지 않을 수도 있습니다.

이 프로젝트를 읽고 일부 네티즌들은 LLaMA의 모델 가중치(코드)를 실제로 얻을 수 있다면 좋겠다고 말하더군요...

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

그러나 일부 네티즌들은 "생각보다 15배 빠르다"고 지적하기도 했습니다. ChatGPT 훈련 방법" 이 진술은 순전히 오해의 소지가 있습니다.

소위 15배 더 빠르다는 것은 단지 LLaMA 모델 자체가 작고 단일 GPU에서도 실행될 수 있기 때문이지만, ChatGPT에서 수행된 어떤 작업 때문이 되어서는 안 됩니다. 이 프로젝트 맞죠?

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

이 네티즌은 도서관에 있는 것보다 더 나은 trlx라는 RLHF 훈련 방법을 추천했습니다. 훈련 속도는 일반적인 RLHF 방법보다 3~4배 빠릅니다.

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

당신이 가져가세요. LLaMA 코드를 얻었나요? 이 훈련 방법에 대해 어떻게 생각하시나요?

ChatLLaMA 주소:https://www.php.cn/link/fed537780f3f29cc5d5f313bbda423c4

참조 링크:https://www.php.cn/link/fe27f92b1e3f4997567807f38d567a35

위 내용은 ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7678

Cakephp 튜토리얼

1393

C# 튜토리얼

1207

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

오픈 소스! ZoeDepth를 넘어! DepthFM: 빠르고 정확한 단안 깊이 추정! Apr 03, 2024 pm 12:04 PM

0. 이 글은 어떤 내용을 담고 있나요? 우리는 다재다능하고 빠른 최첨단 생성 단안 깊이 추정 모델인 DepthFM을 제안합니다. DepthFM은 전통적인 깊이 추정 작업 외에도 깊이 인페인팅과 같은 다운스트림 작업에서 최첨단 기능을 보여줍니다. DepthFM은 효율적이며 몇 가지 추론 단계 내에서 깊이 맵을 합성할 수 있습니다. 이 작품을 함께 읽어보아요~ 1. 논문 정보 제목: DepthFM: FastMoncularDepthEstimationwithFlowMatching 저자: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

블루 스크린 코드 0x0000001이 발생하는 경우 대처 방법 Feb 23, 2024 am 08:09 AM

블루 스크린 코드 0x0000001로 수행할 작업 블루 스크린 오류는 컴퓨터 시스템이나 하드웨어에 문제가 있을 때 나타나는 경고 메커니즘입니다. 코드 0x0000001은 일반적으로 하드웨어 또는 드라이버 오류를 나타냅니다. 사용자가 컴퓨터를 사용하는 동안 갑자기 블루 스크린 오류가 발생하면 당황하고 당황할 수 있습니다. 다행히도 대부분의 블루 스크린 오류는 몇 가지 간단한 단계를 통해 문제를 해결하고 처리할 수 있습니다. 이 기사에서는 독자들에게 블루 스크린 오류 코드 0x0000001을 해결하는 몇 가지 방법을 소개합니다. 먼저, 블루 스크린 오류가 발생하면 다시 시작해 보세요.

안녕하세요, 일렉트릭 아틀라스입니다! 보스턴 다이나믹스 로봇 부활, 180도 이상한 움직임에 겁먹은 머스크 Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas가 공식적으로 전기 로봇 시대에 돌입했습니다! 어제 유압식 Atlas가 역사의 무대에서 "눈물을 흘리며" 물러났습니다. 오늘 Boston Dynamics는 전기식 Atlas가 작동 중이라고 발표했습니다. 상업용 휴머노이드 로봇 분야에서는 보스턴 다이내믹스가 테슬라와 경쟁하겠다는 각오를 다진 것으로 보인다. 새 영상은 공개된 지 10시간 만에 이미 100만 명이 넘는 조회수를 기록했다. 옛 사람들은 떠나고 새로운 역할이 등장하는 것은 역사적 필연이다. 올해가 휴머노이드 로봇의 폭발적인 해라는 것은 의심의 여지가 없습니다. 네티즌들은 “로봇의 발전으로 올해 개막식도 인간처럼 생겼고, 자유도도 인간보다 훨씬 크다. 그런데 정말 공포영화가 아닌가?”라는 반응을 보였다. 영상 시작 부분에서 아틀라스는 바닥에 등을 대고 가만히 누워 있는 모습입니다. 다음은 입이 떡 벌어지는 내용이다

초지능의 생명력이 깨어난다! 하지만 자동 업데이트 AI가 등장하면서 엄마들은 더 이상 데이터 병목 현상을 걱정할 필요가 없습니다. Apr 29, 2024 pm 06:55 PM

세상은 미친 듯이 큰 모델을 만들고 있습니다. 인터넷의 데이터만으로는 충분하지 않습니다. 훈련 모델은 '헝거게임'처럼 생겼고, 전 세계 AI 연구자들은 이러한 데이터를 탐식하는 사람들에게 어떻게 먹이를 줄지 고민하고 있습니다. 이 문제는 다중 모드 작업에서 특히 두드러집니다. 아무것도 할 수 없던 시기에, 중국 인민대학교 학과의 스타트업 팀은 자체 새로운 모델을 사용하여 중국 최초로 '모델 생성 데이터 피드 자체'를 현실화했습니다. 또한 이해 측면과 생성 측면의 두 가지 접근 방식으로 양측 모두 고품질의 다중 모드 새로운 데이터를 생성하고 모델 자체에 데이터 피드백을 제공할 수 있습니다. 모델이란 무엇입니까? Awaker 1.0은 중관촌 포럼에 최근 등장한 대형 멀티모달 모델입니다. 팀은 누구입니까? 소폰 엔진. 런민대학교 힐하우스 인공지능대학원 박사과정 학생인 Gao Yizhao가 설립했습니다.

Sora 'Ke Ling'의 Kuaishou 버전이 테스트용으로 공개되었습니다. 120초가 넘는 비디오를 생성하고 물리학을 더 잘 이해하며 복잡한 움직임을 정확하게 모델링할 수 있습니다. Jun 11, 2024 am 09:51 AM

무엇? 주토피아는 국내 AI로 현실이 되는 걸까? 영상과 함께 노출된 것은 '켈링'이라는 국산 대형 영상세대 신형 모델이다. Sora는 유사한 기술 경로를 사용하고 자체 개발한 여러 기술 혁신을 결합하여 크고 합리적인 움직임뿐만 아니라 물리적 세계의 특성을 시뮬레이션하고 강력한 개념적 결합 능력과 상상력을 갖춘 비디오를 제작합니다. 데이터에 따르면 Keling은 최대 1080p의 해상도로 30fps에서 최대 2분의 초장 영상 생성을 지원하며 다양한 화면비를 지원합니다. 또 다른 중요한 점은 Keling이 실험실에서 공개한 데모나 비디오 결과 시연이 아니라 단편 비디오 분야의 선두주자인 Kuaishou가 출시한 제품 수준 애플리케이션이라는 점입니다. 더욱이 백지 작성이 아닌 실용성에 중점을 두고, 출시되자마자 온라인에 진출하는 데 중점을 두고 있다. 콰이잉에서는 커링의 대형 모델이 출시됐다.

모든 장치에서 GE 범용 원격 코드 프로그램 Mar 02, 2024 pm 01:58 PM

장치를 원격으로 프로그래밍해야 하는 경우 이 문서가 도움이 될 것입니다. 우리는 모든 장치 프로그래밍을 위한 최고의 GE 범용 원격 코드를 공유할 것입니다. GE 리모콘이란 무엇입니까? GEUniversalRemote는 스마트 TV, LG, Vizio, Sony, Blu-ray, DVD, DVR, Roku, AppleTV, 스트리밍 미디어 플레이어 등과 같은 여러 장치를 제어하는 데 사용할 수 있는 리모컨입니다. GEUniversal 리모컨은 다양한 기능과 기능을 갖춘 다양한 모델로 제공됩니다. GEUniversalRemote는 최대 4개의 장치를 제어할 수 있습니다. 모든 장치에서 프로그래밍할 수 있는 최고의 범용 원격 코드 GE 리모컨에는 다양한 장치에서 작동할 수 있는 코드 세트가 함께 제공됩니다. 당신은 할 수있다

미 공군이 주목할만한 최초의 AI 전투기를 선보였습니다! 전 과정에 걸쳐 장관이 직접 간섭 없이 테스트를 진행했고, 10만 줄의 코드를 21차례 테스트했다. May 07, 2024 pm 05:00 PM

최근 군계는 미군 전투기가 이제 AI를 활용해 완전 자동 공중전을 완수할 수 있다는 소식에 충격을 받았다. 네, 얼마 전 미군의 AI 전투기가 최초로 공개되면서 그 미스터리가 드러났습니다. 이 전투기의 정식 명칭은 VISTA(Variable Stability Flight Simulator Test Aircraft)로 미 공군 장관이 직접 조종해 일대일 공중전을 모의 실험한 것이다. 5월 2일, 미 공군 장관 프랭크 켄달(Frank Kendall)이 X-62AVISTA를 타고 에드워드 공군 기지에서 이륙했습니다. 1시간의 비행 동안 모든 비행 작업은 AI에 의해 자동으로 완료되었습니다. Kendall은 "지난 수십 년 동안 우리는 자율 공대공 전투의 무한한 잠재력에 대해 생각해 왔지만 항상 도달할 수 없는 것처럼 보였습니다."라고 말했습니다. 그러나 지금은,

단 250달러에 Hugging Face의 기술 디렉터가 Llama 3를 단계별로 미세 조정하는 방법을 알려드립니다. May 06, 2024 pm 03:52 PM

Meta가 출시한 Llama3, MistralAI가 출시한 Mistral 및 Mixtral 모델, AI21 Lab이 출시한 Jamba 등 친숙한 오픈소스 대형 언어 모델이 OpenAI의 경쟁자가 되었습니다. 대부분의 경우 사용자는 모델의 잠재력을 완전히 활용하기 위해 자신의 데이터를 기반으로 이러한 오픈 소스 모델을 미세 조정해야 합니다. 단일 GPU에서 Q-Learning을 사용하여 작은 언어 모델에 비해 대규모 언어 모델(예: Mistral)을 미세 조정하는 것은 어렵지 않지만 Llama370b 또는 Mixtral과 같은 대규모 모델의 효율적인 미세 조정은 지금까지 과제로 남아 있습니다. . 그래서 HuggingFace의 기술 이사인 Philipp Sch는

See all articles

ChatGPT 훈련 방법의 경량 버전은 오픈 소스입니다! 단 3일 만에 LLaMA를 기반으로 구축되었으며, OpenAI보다 훈련 속도가 15배 빠르다고 합니다.

ChatGPT의 "오픈 소스 방식"으로 LLaMA를 교육합니다

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제