목차
프로젝트 요약
OpenChatKit
text- Generation-webui
KoboldAI-Client
Open-Assistant
stanford_alpaca
ChatRWKV
ChatGLM-6B
xmtf
llama.cpp는 GPU 없이 LLaMA를 실행할 수 있습니다
기술 주변기기 일체 포함 아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

Apr 08, 2023 am 11:41 AM
chatgpt 오픈 소스

ChatGPT가 처음 출시된 지 거의 4개월이 지났습니다. 이 기간 동안 ChatGPT의 놀라운 성능으로 인해 AIGC가 사전에 구현될 수 있을지 궁금해졌습니다.

그러나 잘 알려진 비밀은 ChatGPT가 오픈 소스가 아닐 가능성이 높다는 것입니다. 컴퓨팅 성능과 대규모 교육 데이터에 대한 막대한 투자와 함께 연구 커뮤니티가 구현 프로세스를 복사하는 데 많은 장애물을 설정했습니다.

ChatGPT의 맹공격에 직면한 오픈 소스 대안은 유사한 기능을 달성하지만 대안을 통해 ChatGPT의 작동 메커니즘을 이해할 수도 있습니다.

기술의 발전으로 ChatGPT와 유사한 다른 많은 새로운 AI 모델이 등장했습니다. 이 기사에서는 ChatGPT의 오픈 소스 대체 프로젝트를 살펴보겠습니다. 콘텐츠는 두 부분으로 나누어집니다. 하나는 ChatGPT와 유사한 오픈 소스 프로젝트에 대한 요약이고, 다른 하나는 프로젝트 요약에 대한 보충입니다.

프로젝트 요약

프로젝트 작성자 nichtdax는 9개의 오픈 소스 ChatGPT 대체 프로젝트를 컴파일했습니다. 앞으로 하나씩 소개하겠습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/nichtdax/awesome-totally-open-chatgpt

PaLM-rlhf-pytorch

번째 그 중 하나의 프로젝트는 "PaLM-rlhf-pytorch"이고, 프로젝트 작성자는 Phil Wang입니다. 이 프로젝트는 기본적으로 PaLM을 사용하는 ChatGPT인 PaLM 아키텍처 위에 RLHF(인간 피드백을 통한 강화 학습)를 구현한 것입니다.

이 프로젝트는 GitHub에서 별 5.8,000개를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/lucidrains/PaLM-rlhf-pytorch

아래 그림은 훈련 과정을 보여줍니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

OpenChatKit

두 번째 프로젝트는 "OpenChatKit"으로, 다양한 애플리케이션에 대한 전문 및 일반 챗봇을 만들기 위한 강력한 오픈 소스 기반을 제공합니다. 이 키트에는 명령 조정된 200억 개의 매개변수 언어 모델, 60억 개의 매개변수 조정 모델 및 사용자 정의 저장소의 최신 응답을 처리하는 확장 가능한 검색 시스템이 포함되어 있습니다.

OpenChatKit은 Together, LAION 및 Ontocord.ai가 결합된 OIG-43M 교육 데이터 세트로 교육됩니다. 프로젝트 작성자는 이것이 모델의 출시일 뿐만 아니라 오픈 소스 프로젝트의 시작이라고 말했습니다. 그들은 일련의 도구와 프로세스를 출시하고 커뮤니티 기여를 통해 지속적으로 개선하고 있습니다.

이 프로젝트는 GitHub에서 별 57,000개를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/togethercomputer/OpenChatKit

text- Generation-webui

세 번째 프로젝트는 "text- Generation-webui"입니다. GPT-J 6B, OPT, GALACTICA, LLaMA 및 Pygmalion과 같은 대규모 언어 모델을 실행하기 위한 그래디언트 웹 UI입니다. 본 프로젝트는 텍스트 생성의 AUTOMATIC1111/stable-diffusion-webui를 목표로 합니다.

드롭다운 메뉴를 사용하여 다양한 모델 간 전환, OpenAI 플레이그라운드와 유사한 노트북 모드 제공, 대화 및 롤플레잉을 위한 채팅 모드, GPT-4chan을 위한 아름다운 HTML 출력 생성 등의 기능이 포함되어 있습니다.

이 프로젝트는 GitHub에서 3.4k를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/oobabooga/text- Generation-webui

KoboldAI-Client

네 번째 프로젝트는 "KoboldAI-Client"입니다. 여러 로컬 및 원격 AI 모델을 통해 AI 지원 쓰기를 구현하는 브라우저 기반 프런트 엔드입니다.

KoboldAI-Client는 메모리, 작성자 노트, 세계 정보, 저장 및 로드, 조정 가능한 AI 설정, 서식 지정 옵션 및 기존 텍스트 어드벤처 게임 AI Dungeon 가져오기 기능을 포함한 표준 도구 세트를 제공합니다. Adventure 모드를 켜거나 AI Dungeon Unleashed와 같은 게임을 플레이할 수 있습니다.

이 프로젝트는 GitHub에서 1.4k를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소 : https://github.com/KoboldAI/KoboldAI-Client

Open-Assistant

다섯 번째 프로젝트는 "Open-Assistant"로 누구나 접근할 수 있는 대규모 채팅 기반 언어 모델. 안정적인 확산이 세계가 새로운 방식으로 예술과 이미지를 창조하는 데 도움이 되는 것처럼 프로젝트 작성자는 언어 혁신에 혁명을 일으키기를 희망합니다.

프로젝트 작성자는 50,000개 이상의 목표를 가지고 수동으로 생성된 고품질 명령 실행 샘플(명령 + 응답)을 수집할 계획입니다. 수집된 각 표시에 대해 여러 완료 결과를 샘플링합니다. 다음으로, 지시 및 보상 모델을 기반으로 RLHF 훈련 단계에 들어갑니다.

이 프로젝트는 GitHub에서 19,000개의 별을 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소 : https://github.com/LAION-AI/Open-Assistant

stanford_alpaca

여섯 번째 프로젝트는 "stanford_alpaca"로, 구축하고 공유하는 것을 목표로 합니다. 지침이 따르는 LLaMA 모델. 이 저장소에는 모델 미세 조정을 위한 52k 데이터, 데이터 생성을 위한 코드 및 모델 미세 조정을 위한 코드가 포함되어 있습니다.

이 프로젝트는 GitHub에서 별 9.5,000개를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/tatsu-lab/stanford_alpaca

ChatRWKV

7번째 프로젝트는 "ChatRWKV"로, ChatGPT와 유사하지만 RWKV(100% RNN) 모델을 기반으로 지원되며 오픈 소스입니다. 프로젝트 작성자에 따르면 RWKV는 현재 품질과 확장성 측면에서 트랜스포머와 일치할 수 있는 동시에 더 빠르고 VRAM을 절약할 수 있는 유일한 RNN 모델입니다.

이 프로젝트는 GitHub에서 별 3.5,000개를 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/BlinkDL/ChatRWKV

ChatGLM-6B

8번째 프로젝트는 Zhipu AI사의 오픈 소스 중국어-영어 이중 언어 대화 언어 모델인 "ChatGLM-6B"입니다. 이는 Tsinghua의 기술 성과를 변형한 GLM(일반 언어 모델) 아키텍처를 기반으로 합니다. 62억 개의 매개변수. 모델 양자화 기술과 결합하여 사용자는 이를 소비자급 그래픽 카드에 로컬로 배포할 수 있습니다(INT4 양자화 수준에서는 최소 6GB의 비디오 메모리가 필요함).

ChatGLM-6B는 ChatGPT와 유사한 기술을 사용하며 중국어 Q&A 및 대화에 최적화되어 있습니다. 감독된 미세 조정, 피드백 셀프 서비스, 인간 피드백 강화 학습 및 기타 기술로 보완된 약 1T 식별자를 사용하여 중국어와 영어로 된 이중 언어 교육을 마친 후 62억 개의 매개변수 ChatGLM-6B는 다음과 상당히 일치하는 답변을 생성할 수 있었습니다. 인간의 선호.

그러나 ChatGLM-6B의 규모가 작기 때문에 현재는 사실적/수학적 논리 오류, 유해/편향된 콘텐츠 생성 가능성, 취약한 상황별 기능, 자체 처리 능력 등 몇 가지 제한 사항이 있는 것으로 알려져 있습니다. 혼란, 그리고 중국어 지시와 완전히 모순되는 영어 지시의 생성.

이 프로젝트는 GitHub에서 6,000개의 별을 받았습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소 : https://github.com/THUDM/ChatGLM-6B

xmtf

9번째 프로젝트는 "xmtf"로, "Crosslingual Generalization"이라는 창작논문을 담고 있습니다. " BLOOMZ, mT0, xP3의 모든 구성 요소는 "멀티태스크 미세 조정을 통해"에서 소개되었습니다.

그중 BLOOMZ는 1,760억 개의 매개변수와 개방형 액세스 다중 언어 모델입니다. mT0(여기서는 구체적으로 Google의 T5X를 나타냄)는 영어와 기계 번역으로 된 프롬프트가 포함된 46개 언어로 관리되는 데이터 세트입니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/bigscience-workshop/xmtf

ChatGPT 대체 프로젝트에는 위에서 언급한 모델 외에도 Meta 기반의 대형 모델도 포함되어 있습니다. 오픈 소스 LLaMA(Large Language Model Meta AI) 시리즈에 대한 일부 연구 이 모델 시리즈의 매개변수 수는 70억 ~ 650억 개입니다. 130억 개의 매개변수가 있는 LLaMA 모델은 "대부분의 벤치마크에서" GPT-3(1,750억 개의 매개변수)보다 성능이 뛰어나고 단일 V100 GPU에서 실행될 수 있으며, 650억 개의 매개변수가 있는 가장 큰 LLaMA 모델은 Google Chinchilla-70B 및 PaLM과 비슷합니다. 540B.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

  • 논문 링크: https://research.facebook.com/publications/llama-open-and-efficient-foundation-언어-models/
  • GitHub 링크: https://github. com/facebookresearch/llama

이 연구를 바탕으로 개발자들은 여러 오픈 소스 프로젝트도 제안했습니다.

llama.cpp는 GPU 없이 LLaMA를 실행할 수 있습니다

llama.cpp 프로젝트는 MacBook에서 실행되는 LLaMA를 구현했으며 개발자는 4GB RAM이 있는 Raspberry Pi에서 LLaMA 7B를 성공적으로 실행했습니다. 요약하면 개발자는 GPU가 없어도 LLaMA 모델을 실행할 수 있습니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/ggerganov/llama.cpp

ChatLLaMA

LLaMA 대형 모델 시리즈는 RLHF 방식을 사용하지 않기 때문에 스타트업 Nebuly AI는 LLaMA(ChatLLaMA)의 RLHF 버전 훈련 방식을 오픈소스화했습니다. 훈련 과정은 ChatGPT와 유사하며, 이 프로젝트를 통해 사전 훈련된 LLaMA 모델을 기반으로 ChatGPT 스타일 서비스를 구축할 수 있습니다. ChatGPT에 비해 LLaMA는 아키텍처가 더 작지만 훈련 프로세스와 단일 GPU 추론이 더 빠르고 저렴합니다. 또한 라이브러리는 모든 LLaMA 모델 아키텍처(7B, 13B, 33B, 65B)를 지원하므로 사용자는 다음과 같은 성능 선호도를 추론할 수 있습니다. 모델을 미세 조정합니다.

아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.

프로젝트 주소: https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

더 많은 오픈 소스 프로젝트 참여를 기대합니다. 미래.

위 내용은 아직도 ChatGPT를 플레이할 수 없어 걱정되시나요? 또한 다음과 같은 12가지 오픈 소스 대안을 통해 지능적인 대화를 경험할 수도 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

10가지 권장 오픈 소스 무료 텍스트 주석 도구 10가지 권장 오픈 소스 무료 텍스트 주석 도구 Mar 26, 2024 pm 08:20 PM

텍스트 주석은 텍스트의 특정 내용에 해당하는 레이블이나 태그를 추가하는 작업입니다. 주요 목적은 특히 인공 지능 분야에서 더 심층적인 분석 및 처리를 위해 텍스트에 추가 정보를 제공하는 것입니다. 텍스트 주석은 인공 지능 애플리케이션의 지도형 기계 학습 작업에 매우 중요합니다. 자연어 텍스트 정보를 보다 정확하게 이해하고 텍스트 분류, 감정 분석, 언어 번역 등의 작업 성능을 향상시키기 위해 AI 모델을 훈련하는 데 사용됩니다. 텍스트 주석을 통해 우리는 AI 모델이 텍스트의 개체를 인식하고, 맥락을 이해하고, 새로운 유사한 데이터가 나타날 때 정확한 예측을 하도록 가르칠 수 있습니다. 이 기사에서는 주로 더 나은 오픈 소스 텍스트 주석 도구를 권장합니다. 1.라벨스튜디오https://github.com/Hu

이제 ChatGPT를 사용하면 무료 사용자가 일일 한도가 있는 DALL-E 3를 사용하여 이미지를 생성할 수 있습니다. 이제 ChatGPT를 사용하면 무료 사용자가 일일 한도가 있는 DALL-E 3를 사용하여 이미지를 생성할 수 있습니다. Aug 09, 2024 pm 09:37 PM

DALL-E 3는 이전 모델보다 대폭 개선된 모델로 2023년 9월 공식 출시되었습니다. 복잡한 디테일의 이미지를 생성할 수 있는 현재까지 최고의 AI 이미지 생성기 중 하나로 간주됩니다. 그러나 출시 당시에는 제외되었습니다.

15가지 추천 오픈 소스 무료 이미지 주석 도구 15가지 추천 오픈 소스 무료 이미지 주석 도구 Mar 28, 2024 pm 01:21 PM

이미지 주석은 이미지 콘텐츠에 더 깊은 의미와 설명을 제공하기 위해 이미지에 레이블이나 설명 정보를 연결하는 프로세스입니다. 이 프로세스는 비전 모델을 훈련하여 이미지의 개별 요소를 보다 정확하게 식별하는 데 도움이 되는 기계 학습에 매우 중요합니다. 이미지에 주석을 추가함으로써 컴퓨터는 이미지 뒤의 의미와 맥락을 이해할 수 있으므로 이미지 내용을 이해하고 분석하는 능력이 향상됩니다. 이미지 주석은 컴퓨터 비전, 자연어 처리, 그래프 비전 모델 등 다양한 분야를 포괄하여 차량이 도로의 장애물을 식별하도록 지원하는 등 광범위한 애플리케이션을 보유하고 있습니다. 의료영상인식을 통한 질병진단. 이 기사에서는 주로 더 나은 오픈 소스 및 무료 이미지 주석 도구를 권장합니다. 1.마케센스

권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 Apr 03, 2024 am 11:55 AM

얼굴 검출 및 인식 기술은 이미 상대적으로 성숙하고 널리 사용되는 기술입니다. 현재 가장 널리 사용되는 인터넷 응용 언어는 JS입니다. 웹 프런트엔드에서 얼굴 감지 및 인식을 구현하는 것은 백엔드 얼굴 인식에 비해 장점과 단점이 있습니다. 장점에는 네트워크 상호 작용 및 실시간 인식이 줄어 사용자 대기 시간이 크게 단축되고 사용자 경험이 향상된다는 단점이 있습니다. 모델 크기에 따라 제한되고 정확도도 제한됩니다. js를 사용하여 웹에서 얼굴 인식을 구현하는 방법은 무엇입니까? 웹에서 얼굴 인식을 구현하려면 JavaScript, HTML, CSS, WebRTC 등 관련 프로그래밍 언어 및 기술에 익숙해야 합니다. 동시에 관련 컴퓨터 비전 및 인공지능 기술도 마스터해야 합니다. 웹 측면의 디자인으로 인해 주목할 가치가 있습니다.

대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 Apr 02, 2024 am 11:31 AM

다중 모드 문서 이해 기능을 위한 새로운 SOTA! Alibaba mPLUG 팀은 최신 오픈 소스 작업인 mPLUG-DocOwl1.5를 출시했습니다. 이 작품은 고해상도 이미지 텍스트 인식, 일반 문서 구조 이해, 지침 따르기, 외부 지식 도입이라는 4가지 주요 과제를 해결하기 위한 일련의 솔루션을 제안했습니다. 더 이상 고민하지 말고 먼저 효과를 살펴보겠습니다. 복잡한 구조의 차트도 한 번의 클릭으로 인식하고 마크다운 형식으로 변환 가능: 다양한 스타일의 차트 사용 가능: 보다 자세한 텍스트 인식 및 위치 지정도 쉽게 처리 가능: 문서 이해에 대한 자세한 설명도 제공 가능: 아시다시피, " 문서 이해"는 현재 대규모 언어 모델 구현을 위한 중요한 시나리오입니다. 시장에는 문서 읽기를 지원하는 많은 제품이 있습니다. 그 중 일부는 주로 텍스트 인식을 위해 OCR 시스템을 사용하고 텍스트 처리를 위해 LLM을 사용합니다.

휴대폰에 chatgpt를 설치하는 방법 휴대폰에 chatgpt를 설치하는 방법 Mar 05, 2024 pm 02:31 PM

설치 단계: 1. ChatGTP 공식 웹사이트 또는 모바일 스토어에서 ChatGTP 소프트웨어를 다운로드합니다. 2. 이를 연 후 설정 인터페이스에서 언어를 중국어로 선택합니다. 3. 게임 인터페이스에서 인간-기계 게임을 선택하고 설정합니다. 4. 시작한 후 채팅 창에 명령을 입력하여 소프트웨어와 상호 작용합니다.

방금 출시되었습니다! 한 번의 클릭으로 애니메이션 스타일의 이미지를 생성할 수 있는 오픈 소스 모델 방금 출시되었습니다! 한 번의 클릭으로 애니메이션 스타일의 이미지를 생성할 수 있는 오픈 소스 모델 Apr 08, 2024 pm 06:01 PM

최신 AIGC 오픈소스 프로젝트인 AnimagineXL3.1을 소개하겠습니다. 이 프로젝트는 사용자에게 더욱 최적화되고 강력한 애니메이션 이미지 생성 경험을 제공하는 것을 목표로 하는 애니메이션 테마의 텍스트-이미지 모델의 최신 버전입니다. AnimagineXL3.1에서 개발 팀은 모델이 성능과 기능 면에서 새로운 수준에 도달할 수 있도록 여러 주요 측면을 최적화하는 데 중점을 두었습니다. 첫째, 이전 버전의 게임 캐릭터 데이터뿐만 아니라 다른 많은 유명 애니메이션 시리즈의 데이터도 훈련 세트에 포함하도록 훈련 데이터를 확장했습니다. 이러한 움직임은 모델의 지식 기반을 풍부하게 하여 다양한 애니메이션 스타일과 캐릭터를 더 완벽하게 이해할 수 있게 해줍니다. AnimagineXL3.1은 새로운 특수 태그 및 미학 세트를 소개합니다.

단일 카드는 듀얼 카드보다 Llama를 70B 더 빠르게 실행합니다. Microsoft는 A100에 FP6을 넣었습니다 | 단일 카드는 듀얼 카드보다 Llama를 70B 더 빠르게 실행합니다. Microsoft는 A100에 FP6을 넣었습니다 | Apr 29, 2024 pm 04:55 PM

FP8 이하의 부동 소수점 수량화 정밀도는 더 이상 H100의 "특허"가 아닙니다! Lao Huang은 모든 사람이 INT8/INT4를 사용하기를 원했고 Microsoft DeepSpeed ​​팀은 NVIDIA의 공식 지원 없이 A100에서 FP6을 실행하기 시작했습니다. 테스트 결과에 따르면 A100에 대한 새로운 방법 TC-FPx의 FP6 양자화는 INT4에 가깝거나 때로는 더 빠르며 후자보다 정확도가 더 높은 것으로 나타났습니다. 또한 오픈 소스로 제공되고 DeepSpeed와 같은 딥 러닝 추론 프레임워크에 통합된 엔드투엔드 대규모 모델 지원도 있습니다. 이 결과는 대형 모델 가속화에도 즉각적인 영향을 미칩니다. 이 프레임워크에서는 단일 카드를 사용하여 Llama를 실행하면 처리량이 듀얼 카드보다 2.65배 더 높습니다. 하나

See all articles