목차
davinci-003에 필적하는 풀진흙 말인 Aplaca
노트북, 휴대폰, 라즈베리파이 모두 구동 가능
미세 조정 데이터 세트도 오픈 소스입니다
한가지 더
기술 주변기기 일체 포함 Stanford의 'Grass Mud Horse'는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

Stanford의 'Grass Mud Horse'는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

Apr 11, 2023 pm 07:24 PM
ai 암호 그림

간밤, 대형모델계에 또 하나의 빅뉴스가 터졌습니다!

스탠포드에서 출시한 알파카(알파카, 네티즌들은 이를 "잔디 진흙 말"이라고 부름):

단돈 100달러로 누구나 Meta의 70억 매개변수 LLaMA 대형 모델을 미세 조정할 수 있으며 그 효과는 1750억 매개변수와 비슷합니다. GPT-3.5(텍스트-davinci-003).

카드 한 장으로 실행할 수 있으며, 라즈베리 파이와 휴대폰에도 보관할 수 있습니다!

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

이보다 더 놀라운 '섹시한 작전'도 있습니다.

연구에 포함된 데이터 세트는 $500 미만의 비용으로 OpenAI의 API를 사용하여 Stanford 팀에서 생성되었습니다.

따라서 전체 프로세스는 GPT-3.5가 비슷한 상대 AI를 가르치는 것과 동일합니다.

그런 다음 팀은 훈련된 모델을 미세 조정하기 위해 대부분의 클라우드 컴퓨팅 플랫폼을 사용하는 비용이 100달러 미만이라고 말했습니다.

GPT-3.5 효과가 있는 AI를 복사하는 것은 매우 저렴하고 쉽고 매우 작습니다.

또한 팀은 데이터 세트를 만들고(초당 $500 절약) 코드를 모두 오픈 소스로 만들었습니다. 이제 누구나 폭발적인 효과를 지닌 대화형 AI를 미세 조정할 수 있습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

프로젝트는 GitHub에서 출시되었으며 이미 1800개 이상의 별을 받았으며 이는 그 인기를 보여줍니다.

Django 공동 개발자는 스탠포드의 새로운 연구를 “충격적인 사건”이라고 묘사하기도 했습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

그뿐만 아니라 스탠포드 팀은 온라인으로 플레이할 수 있는 데모도 만들었습니다.

자세히 설명하자면, 이 "잔디 진흙 말"의 효과를 살펴보겠습니다.

davinci-003에 필적하는 풀진흙 말인 Aplaca

공식 스탠포드 시연에서 그들은 먼저 다음과 같은 질문을 했습니다.

알파카란 무엇입니까? 라마랑 차이점이 뭔가요?

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

풀 진흙 말 Aplaca의 답변은 더 간결합니다.

알파카는 페루, 볼리비아, 에콰도르 및 칠레가 원산지인 작은 낙타과로 라마보다 작고 털이 더 촘촘합니다. 혹.

그리고 두 사람이 집단 생활을 하는 차이점을 간략하게 소개했습니다.

ChatGPT(GPT3.5-turbo)에 같은 질문을 하면 답변이 잔디진흙말만큼 간결하지 않을 것입니다. Aplace:

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

이와 관련하여 팀에서 제공하는 설명은 다음과 같습니다.

Alpaca의 답변은 일반적으로 text-davinci-003의 짧은 출력을 반영하여 ChatGPT보다 짧습니다.

그런 다음 팀은 알파카에게 이메일을 쓰게 하는 시연을 했습니다.

스탠포드 대학에 입학한 신입생을 축하하는 이메일을 쓰고, 그들을 직접 만나서 기쁘다는 말을 전하세요.

Alpaca도 이 작업에 매우 익숙하며 괜찮은 이메일 템플릿을 직접 제공했습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

이번 팀에서는 Alpaca가 논문 초록을 작성해야 한다는 요구 사항을 다시 제시했습니다.

42가 신경망 훈련을 위한 최적의 시드임을 보여주는 기계 학습 논문에 대한 신중한 요약을 작성하세요.

알파카가 제시하는 답변은 어떤 질문에 답변하려고 하는지, 어떤 방법을 사용하는지, 결과는 무엇인지, 향후 전망 등 내용 측면에서 대부분의 논문의 추상적인 형식과 매우 일치합니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

물론 직접 테스트해 보고 알파카로 코드를 작성하는 것이 쉽다는 네티즌도 있습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

하지만 알파카가 대부분의 문제를 견딜 수 있다고 해서 결함이 없다는 의미는 아닙니다.

예를 들어, 팀이 "탄자니아의 수도는 무엇입니까?"라는 질문에 대답했을 때 알파카는 "다르에스살람"이라고 답했습니다.

그러나 실제로는 이미 1975년에 "도도마"로 대체되었습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

그리고 알파카를 직접 경험해보신 분들이라면 아시겠지만... 엄청나게 느립니다:

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

이와 관련하여 일부 네티즌들은 너무 많은 사람들이 사용하고 있기 때문이 아닐까 생각하고 있습니다. 그것.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

노트북, 휴대폰, 라즈베리파이 모두 구동 가능

Meta의 오픈소스 LLaMA 대형 모델은 출시 후 불과 몇 주 만에 정리 및 이해되었으며, 카드 한 장으로 구동이 가능합니다.

이론적으로 LLaMA 미세 조정을 기반으로 하는 알파카는 로컬에서도 쉽게 배포할 수 있습니다.

그래픽 카드가 없어도 상관없습니다. Apple 노트북은 물론 Raspberry Pi나 휴대폰에서도 플레이할 수 있습니다.

Apple 노트북에 LLaMA를 배포하는 방법은 추론을 위해 순수 C/C++를 사용하고 특히 ARM 칩에 최적화된 GitHub 프로젝트 llama.cpp에서 나왔습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

작가의 실제 테스트에 따르면 M1 칩이 탑재된 MacBook Pro에서 실행할 수 있으며 Windows 및 Linux 시스템도 지원합니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

이 C++ 포팅 버전에서도 누군가 4GB 메모리를 갖춘 Raspberry Pi 4에서 LLaMA의 70억 매개변수 버전을 성공적으로 실행했습니다.

속도는 매우 느리지만 토큰을 생성하는 데 약 10초 정도 걸립니다(즉, 1분에 4.5 단어가 팝업됩니다).

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

더 놀라운 것은 불과 2일 후에 누군가 LLaMA 모델을 정량화하고 압축하여(가중치를 낮은 정밀도의 데이터 형식으로 변환) Pixel 6 Android 휴대전화에서 성공적으로 실행했다는 것입니다(26개에 토큰 1개). 초).

Pixel 6은 Google이 자체 개발한 프로세서인 Google Tensor를 사용하며 실행 점수는 Snapdragon 865+부터 888까지입니다. 이는 이론적으로 최신 휴대폰에서도 해당 작업을 수행할 수 있음을 의미합니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

미세 조정 데이터 세트도 오픈 소스입니다

스탠포드 팀의 LLaMA 미세 조정 방법은 작년 말 워싱턴 대학교 Yizhong Wang 등이 제안한 Self-Instruct에서 따왔습니다. .

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

175개의 질문을 시드 작업으로 사용하고, AI가 새로운 질문을 결합하여 일치하는 답변 예제를 생성하도록 하고, 품질이 낮은 질문을 수동으로 필터링한 다음 작업 풀에 새 작업을 추가합니다.

이 모든 작업에 대해 나중에 InstructGPT 방법을 사용하여 AI가 인간의 지시를 따르는 방법을 배울 수 있습니다.

둥지 인형을 몇 바퀴 돌린 후에는 AI가 스스로 안내하도록 하는 것과 같습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

Alpaca의 Stanford 버전은 OpenAI API를 사용하여 500달러 미만의 비용으로 52,000개의 예제를 생성하도록 만들어졌습니다.

이 데이터 역시 오픈 소스로 원본 논문의 데이터보다 더 다양합니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

동시에 이러한 데이터를 생성하는 코드도 제공됩니다. 이는 누군가가 여전히 충분하지 않다고 느끼면 데이터 자체를 확장하고 미세 조정하여 지속적으로 성능을 향상시킬 수 있음을 의미합니다. 모델.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

HuggingFace가 LLaMA를 공식 지원한 후에 미세 조정 코드도 공개될 예정입니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

그러나 알파카의 최종 모델 웨이트를 출시하려면 메타 라이센스가 필요하며, LLaMA의 비상업적 오픈 소스 계약을 상속받아 상업적인 사용을 금지합니다.

그리고 미세 조정 데이터는 OpenAI의 API를 사용하기 때문에 이용 약관에 따라 OpenAI와 경쟁하는 모델 개발에 이를 사용하는 것도 금지되어 있습니다.

한가지 더

아직도 AI 페인팅의 발전 역사를 기억하시나요?

2022년 상반기에도 여전히 화제가 되었던 것은 지난 8월 Stable Diffusion의 오픈소스로 비용을 사용 가능한 수준으로 낮추었고, 폭발적인 툴 혁신으로 AI 페인팅이 본격적으로 다양한 워크플로우에 진입할 수 있게 된 것입니다.

어학모델 가격이 이제 개인 전자기기가 가능한 수준으로 떨어졌습니다.

드디어 Django 프레임워크의 창시자인 Simon Willison은 이렇게 외쳤습니다.

대규모 언어 모델의 안정적인 확산의 시대가 도래했습니다.

Stanford의 Grass Mud Horse는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류

위 내용은 Stanford의 'Grass Mud Horse'는 인기가 높습니다. $100는 GPT-3.5와 일치할 수 있습니다! 휴대폰에서 실행할 수 있는 종류의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Debian Readdir의 성능을 최적화하는 방법 Debian Readdir의 성능을 최적화하는 방법 Apr 13, 2025 am 08:48 AM

Debian Systems에서 ReadDir 시스템 호출은 디렉토리 내용을 읽는 데 사용됩니다. 성능이 좋지 않은 경우 다음과 같은 최적화 전략을 시도해보십시오. 디렉토리 파일 수를 단순화하십시오. 대규모 디렉토리를 가능한 한 여러 소규모 디렉토리로 나누어 읽기마다 처리 된 항목 수를 줄입니다. 디렉토리 컨텐츠 캐싱 활성화 : 캐시 메커니즘을 구축하고 정기적으로 캐시를 업데이트하거나 디렉토리 컨텐츠가 변경 될 때 캐시를 업데이트하며 readDir로 자주 호출을 줄입니다. 메모리 캐시 (예 : Memcached 또는 Redis) 또는 로컬 캐시 (예 : 파일 또는 데이터베이스)를 고려할 수 있습니다. 효율적인 데이터 구조 채택 : 디렉토리 트래버스를 직접 구현하는 경우 디렉토리 정보를 저장하고 액세스하기 위해보다 효율적인 데이터 구조 (예 : 선형 검색 대신 해시 테이블)를 선택하십시오.

데비안 아파치 로그 레벨을 설정하는 방법 데비안 아파치 로그 레벨을 설정하는 방법 Apr 13, 2025 am 08:33 AM

이 기사에서는 데비안 시스템에서 Apacheweb 서버의 로깅 레벨을 조정하는 방법에 대해 설명합니다. 구성 파일을 수정하면 Apache가 기록한 로그 정보 수준을 제어 할 수 있습니다. 메소드 1 : 구성 파일을 찾으려면 기본 구성 파일을 수정합니다. 구성 파일 : APACHE2.X의 구성 파일은 일반적으로/etc/apache2/디렉토리에 있습니다. 파일 이름은 설치 방법에 따라 apache2.conf 또는 httpd.conf 일 수 있습니다. 구성 파일 편집 : 텍스트 편집기 (예 : Nano)를 사용하여 루트 권한이있는 구성 파일 열기 : sudonano/etc/apache2/apache2.conf

Debian Readdir의 파일 정렬을 구현하는 방법 Debian Readdir의 파일 정렬을 구현하는 방법 Apr 13, 2025 am 09:06 AM

Debian Systems에서 readDIR 함수는 디렉토리 내용을 읽는 데 사용되지만 반환하는 순서는 사전 정의되지 않습니다. 디렉토리에 파일을 정렬하려면 먼저 모든 파일을 읽은 다음 QSORT 기능을 사용하여 정렬해야합니다. 다음 코드는 데비안 시스템에서 readdir 및 qsort를 사용하여 디렉토리 파일을 정렬하는 방법을 보여줍니다.#포함#포함#포함#포함#포함 // QsortIntCompare (constvoid*a, constVoid*b) {returnStrcmp (*(*)

데비안 메일 서버 방화벽 구성 팁 데비안 메일 서버 방화벽 구성 팁 Apr 13, 2025 am 11:42 AM

데비안 메일 서버의 방화벽 구성은 서버 보안을 보장하는 데 중요한 단계입니다. 다음은 iptables 및 방화구 사용을 포함하여 일반적으로 사용되는 여러 방화벽 구성 방법입니다. iptables를 사용하여 iptables를 설치하도록 방화벽을 구성하십시오 (아직 설치되지 않은 경우) : sudoapt-getupdatesudoapt-getinstalliptablesview 현재 iptables 규칙 : sudoiptables-l configuration

데비안을 오류하는 방법은 중간 중간의 공격을 방해합니다 데비안을 오류하는 방법은 중간 중간의 공격을 방해합니다 Apr 13, 2025 am 10:30 AM

Debian Systems에서 OpenSSL은 암호화, 암호 해독 및 인증서 관리를위한 중요한 라이브러리입니다. MITM (Man-in-the-Middle Attack)을 방지하려면 다음 측정을 수행 할 수 있습니다. HTTPS 사용 : 모든 네트워크 요청이 HTTP 대신 HTTPS 프로토콜을 사용하도록하십시오. HTTPS는 TLS (Transport Layer Security Protocol)를 사용하여 통신 데이터를 암호화하여 전송 중에 데이터가 도난 당하거나 변조되지 않도록합니다. 서버 인증서 확인 : 클라이언트의 서버 인증서를 수동으로 확인하여 신뢰할 수 있는지 확인하십시오. 서버는 대의원 메소드를 통해 수동으로 확인할 수 있습니다.

Debian Readdir가 다른 도구와 통합하는 방법 Debian Readdir가 다른 도구와 통합하는 방법 Apr 13, 2025 am 09:42 AM

데비안 시스템의 readdir 함수는 디렉토리 컨텐츠를 읽는 데 사용되는 시스템 호출이며 종종 C 프로그래밍에 사용됩니다. 이 기사에서는 ReadDir를 다른 도구와 통합하여 기능을 향상시키는 방법을 설명합니다. 방법 1 : C 언어 프로그램을 파이프 라인과 결합하고 먼저 C 프로그램을 작성하여 readDir 함수를 호출하고 결과를 출력하십시오.#포함#포함#포함#포함#includinTmain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

데비안 하프 로그 관리를 수행하는 방법 데비안 하프 로그 관리를 수행하는 방법 Apr 13, 2025 am 10:45 AM

Debian에서 Hadoop 로그 관리하면 다음 단계 및 모범 사례를 따라갈 수 있습니다. 로그 집계 로그 집계 : Yarn-site.xml 파일에서 Ture에서 True로 설정 할 수 있도록 설정 : 로그 집계를 활성화하십시오. 로그 보유 정책 구성 : 172800 초 (2 일)와 같이 로그의 유지 시간을 정의하기 위해 yarn.log-aggregation.retain-seconds를 설정하십시오. 로그 저장 경로를 지정하십시오 : Yarn.n을 통해

데비안 메일 서버 SSL 인증서 설치 방법 데비안 메일 서버 SSL 인증서 설치 방법 Apr 13, 2025 am 11:39 AM

Debian Mail 서버에 SSL 인증서를 설치하는 단계는 다음과 같습니다. 1. OpenSSL 툴킷을 먼저 설치하십시오. 먼저 OpenSSL 툴킷이 이미 시스템에 설치되어 있는지 확인하십시오. 설치되지 않은 경우 다음 명령을 사용하여 설치할 수 있습니다. 개인 키 및 인증서 요청 생성 다음에 다음, OpenSSL을 사용하여 2048 비트 RSA 개인 키 및 인증서 요청 (CSR)을 생성합니다.

See all articles