Open Source PaLM

설치" >설치

Training" >Training

Data " >Data

PaLM 2 출시 예정

집

기술 주변기기

일체 포함

Google은 PaLM을 오픈소스로 제공하지 않지만 네티즌들은 이를 오픈소스로 제공합니다! 수천억 개의 매개변수의 미니어처 버전: 최대값은 10억 개, 8K 컨텍스트입니다.

Google은 PaLM을 오픈소스로 제공하지 않지만 네티즌들은 이를 오픈소스로 제공합니다! 수천억 개의 매개변수의 미니어처 버전: 최대값은 10억 개, 8K 컨텍스트입니다.

王林

May 28, 2023 pm 09:40 PM

Google 오픈 소스

구글이 오픈소스로 제공하지 않았던 PaLM이 네티즌들에 의해 오픈소스로 공개되었습니다.

어제 개발자가 GitHub에서 PaLM 모델의 세 가지 소형 버전을 오픈 소스로 공개했습니다. 매개변수는 1억 5천만(PalM-150m), 4억 1천만(PalM-410m) 및 10억(PalM-1b)입니다.

프로젝트 주소: https://github.com/conceptofmind/PaLM

이 세 가지 모델은 컨텍스트 길이가 8k인 Google C4 데이터 세트에서 훈련되었습니다. 앞으로는 20억 개의 매개변수를 가진 모델이 훈련될 예정입니다.

Google C4 데이터세트

Open Source PaLM

4억 1천만 개의 매개변수 모델을 사용하여 생성된 예:

우리 개는 매우 귀엽지만 다른 개들과의 사교 능력은 그리 좋지 않습니다. 그 개는 새로운 사람들을 모두 사랑하고 다른 개들과 어울리는 것을 좋아합니다. 다른 개들과 함께 공원에 데려가야 합니다. 그 개는 약간의 입 냄새를 풍기지만, 그렇지 않은 방향으로 도망갈 때만 그렇습니다. 현재 내 개는 매우 버릇없어서 공원에서 인사하고 싶지만 당분간은 몸을 잘 돌봐야 할 것 같습니다. 3개월이 지났습니다. 개는 매우 소심하고 겁이 많습니다. 개는 매우 장난스럽고 버릇이 없습니다. 개 때문인지 버릇없는지 잘 모르겠습니다. 그는 장난감을 좋아하고 그냥 놀고 싶어합니다. 그는 항상 장난감을 가지고 놀고 심지어 산책도 합니다. 그 개는 그냥 공원에 가는 작은 강아지예요. 입 냄새나 입 냄새도 나지 않은 아주 친근한 강아지예요

저희 강아지는 엄청 귀엽지만 다른 강아지들과 잘 어울리지 못해요. . 이 개는 모든 새로운 사람을 사랑하며 다른 개들과 노는 것을 좋아합니다. 다른 개들과 함께 공원에 데려가야 해요. 강아지 호흡이 약간 있는 편인데 가고 싶지 않은 방향으로 달릴 때만요. 이제 내 개는 매우 장난 꾸러기입니다. 그는 공원에서 인사하고 싶었지만 잠시 동안 몸을 돌보고 싶었습니다. 그는 또한 구취를 가지고 있습니다. 그에게 구강 교정기를 사줘야 했던 지 3개월이 지났습니다. 개는 입 주위에 아픈 물린 자국이 있습니다. 이 개는 매우 소심하고 겁이 많습니다. 이 개는 매우 장난스럽고 약간 버릇이 없습니다. 강아지의 잘못인지, 아니면 그냥 버릇없게 생긴 것인지는 잘 모르겠습니다. 그는 장난감을 좋아하고 단지 가지고 놀고 싶어합니다. 그는 항상 장난감을 가지고 놀고 심지어 산책도 하러 갑니다. 그는 약간 까다롭고 다른 개들과 잘 어울리지 않습니다. 그 개는 단지 공원에 가는 강아지일 뿐이었습니다. 그는 매우 친절한 개입니다. 그는 더 이상 구취 문제가 없습니다.

매개변수가 실제로 약간 작지만 생성된 효과는 여전히 설명하기가 조금 어렵습니다...

이 모델은 Toolformer-pytorch, Palm-rlhf-pytorch와 같은 많은 인기 있는 Lucidrain 저장소와 호환됩니다. 그리고 Palm-pytorch.

세 가지 최신 오픈 소스 모델은 기본 모델이며 대규모 데이터 세트에서 학습됩니다.

모든 모델은 FLAN 지침에 따라 추가 조정되어 flan-PaLM 모델을 제공할 예정입니다.

오픈 소스 PaLM 모델은 Flash Attention 및 Xpos Rotary Embeddings를 통해 학습되므로 더 나은 길이 추정을 달성하고 보다 효율적인 디코딩을 위해 다중 쿼리 단일 키 값 주의 메커니즘을 사용합니다.

최적화 알고리즘 측면에서는 분리된 가중치 감쇠 Adam W를 사용하지만 Mitchell Wortsman의 Stable Adam W를 사용할 수도 있습니다.

현재 모델은 Torch 허브에 업로드되었으며 파일도 Huggingface 허브에 저장되어 있습니다.

Torch 허브에서 모델을 제대로 다운로드할 수 없는 경우 .cache/torch/hub/에서 체크포인트와 모델 폴더를 삭제했는지 확인하세요. 문제가 여전히 해결되지 않으면 Huggingface 저장소에서 파일을 다운로드할 수 있습니다. 현재 Huggingface 통합이 진행 중입니다.

모든 학습 데이터에는 GPTNEOX 태거가 사전 라벨링되어 있으며 시퀀스 길이는 8192로 잘립니다. 이를 통해 데이터 전처리에 드는 비용을 크게 절감할 수 있습니다.

이 데이터 세트는 Huggingface에 쪽모이 세공 형식으로 저장되었으며 여기에서 개별 데이터 청크를 찾을 수 있습니다: C4 Chunk 1, C4 Chunk 2, C4 Chunk 3, C4 Chunk 4 및 C4 Chunk 5.

분산 학습 스크립트에는 제공된 사전 레이블이 지정된 C4 데이터세트를 사용하는 것이 아니라 openwebtext와 같은 다른 데이터세트를 로드하고 처리하는 또 다른 옵션이 있습니다.

설치

모델을 실행하기 전에 설치 과정이 필요합니다.

<code>git clone https://github.com/conceptofmind/PaLM.gitcd PaLM/pip3 install -r requirements.txt</code>

로그인 후 복사

을 사용하면 추가 훈련이나 미세 조정을 위해 Torch 허브를 사용하여 사전 훈련된 모델을 로드할 수 있습니다.

<code>model = torch.hub.load("conceptofmind/PaLM", "palm_410m_8k_v0").cuda()</code>

로그인 후 복사

또한 다음 방법을 통해 PyTorch 모델 체크포인트를 직접 로드할 수도 있습니다.

<code>from palm_rlhf_pytorch import PaLMmodel = PaLM(num_tokens=50304, dim=1024, depth=24, dim_head=128, heads=8, flash_attn=True, qk_rmsnorm = False,).cuda()model.load('/palm_410m_8k_v0.pt')</code>

로그인 후 복사

모델을 사용하여 텍스트를 생성하려면 다음 명령줄을 사용할 수 있습니다.

prompt - 텍스트 생성에 대한 프롬프트.

seq_len - 생성된 텍스트의 시퀀스 길이, 기본값은 256입니다.

온도 - 샘플링 온도, 기본값은 0.8입니다.

filter_thres - 샘플링에 사용되는 필터 임계값입니다. 기본값은 0.9입니다.

model - 세대에 사용되는 모델입니다. 세 가지 매개변수(150m, 410m, 1b)가 있습니다: palm_150m_8k_v0, palm_410m_8k_v0, palm_1b_8k_v0.

<code>python3 inference.py "My dog is very cute" --seq_len 256 --temperature 0.8 --filter_thres 0.9 --model "palm_410m_8k_v0"</code>

로그인 후 복사

추론에서는 성능을 향상시키기 위해 torch.compile(), Flash Attention 및 Hidet을 사용합니다.

스트림 처리나 다른 기능을 추가하여 세대를 확장하려는 경우 저자는 일반적인 추론 스크립트 "inference.py"를 제공합니다.

Training

이 "오픈 소스 Palm" 모델은 64개의 A100(80GB) GPU에서 훈련되었습니다.

모델 교육을 용이하게 하기 위해 저자는 분산 교육 스크립트 train_distributed.py도 제공합니다.

하드웨어 요구 사항에 맞게 모델 레이어와 하이퍼파라미터 구성을 자유롭게 변경할 수 있으며, 모델의 가중치를 로드하고 훈련 스크립트를 변경하여 모델을 미세 조정할 수도 있습니다.

마지막으로 저자는 앞으로 구체적인 미세 조정 스크립트를 추가하고 LoRA를 탐구하겠다고 밝혔습니다.

Data

학습 중에 사용된 C4 데이터세트와 유사한 방식으로 build_dataset.py 스크립트를 실행하여 다양한 데이터세트를 전처리할 수 있습니다. 그러면 데이터에 미리 레이블이 지정되고 지정된 시퀀스 길이의 청크로 분할되어 Huggingface 허브에 업로드됩니다.

예:

<code>python3 build_dataset.py --seed 42 --seq_len 8192 --hf_account "your_hf_account" --tokenizer "EleutherAI/gpt-neox-20b" --dataset_name "EleutherAI/the_pile_deduplicated"</code>

로그인 후 복사

PaLM 2 출시 예정

2022년 4월 Google은 처음으로 5,400억 개의 매개변수가 포함된 PaLM을 공식 발표했습니다. 다른 LLM과 마찬가지로 PaLM은 다양한 텍스트 생성 및 편집 작업을 수행할 수 있습니다.

PaLM은 Google이 처음으로 Pathways 시스템을 대규모로 사용하여 현재까지 훈련에 사용되는 TPU 기반 시스템 구성 중 가장 큰 6144 칩으로 훈련을 확장합니다.

농담을 이해할 수 있을 뿐만 아니라, 이해하지 못하는 당신에게 재미있는 점을 설명해주는 이해력도 뛰어납니다.

3월 중순에 Google은 처음으로 PaLM 대규모 언어 모델 API를 공개했습니다.

즉, 사람들은 텍스트 요약, 코드 작성 등의 작업을 완료하고 PaLM을 ChatGPT와 같은 대화형 챗봇으로 훈련시키는 데 사용할 수 있습니다.

다가오는 Google 연례 I/O 컨퍼런스에서 Pichai는 AI 분야에서 회사의 최신 개발을 발표할 예정입니다.

최신, 가장 발전된 대규모 언어 모델 PaLM 2가 곧 출시된다고 합니다.

PaLM 2에는 100개 이상의 언어가 포함되어 있으며 내부 코드명 "Unified Language Model"로 실행되어 왔습니다. 또한 코딩, 수학, 창의적 글쓰기 분야에서 광범위한 테스트를 실시합니다.

지난달 구글은 자사의 의료 LLM 'Med-PalM2'가 '전문 의사 수준'에서 85%의 정확도로 건강 검진 문제에 답할 수 있다고 밝혔습니다.

또한 Google은 대형 모델이 지원하는 채팅 로봇 Bard와 검색 생성 경험도 출시할 예정입니다.

최신 AI 출시가 구글의 등을 바로잡을 수 있을지는 두고 볼 일이다.

위 내용은 Google은 PaLM을 오픈소스로 제공하지 않지만 네티즌들은 이를 오픈소스로 제공합니다! 수천억 개의 매개변수의 미니어처 버전: 최대값은 10억 개, 8K 컨텍스트입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7473

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

DeepSeek에 의견을 말하는 방법 Feb 19, 2025 pm 05:42 PM

DeepSeek은 강력한 정보 검색 도구입니다.이 장점은 정보가 느리고 결과 프레젠테이션 방법이 간단하며 데이터베이스 적용 범위는 제한되어 있다는 것입니다 .

DeepSeek을 검색하는 방법 Feb 19, 2025 pm 05:39 PM

DeepSeek은 특정 데이터베이스 나 시스템에서만 더 빠르고 정확한 독점 검색 엔진입니다. 이를 사용할 때 사용자는 문서를 읽고, 다양한 검색 전략을 시도하고, 사용자 경험에 대한 도움을 요청하고 사용자 경험에 대한 피드백을 최대한 활용하는 것이 좋습니다.

참깨 오픈 도어 교환 웹 페이지 등록 링크 게이트 트레이딩 앱 등록 웹 사이트 최신 Feb 28, 2025 am 11:06 AM

이 기사에서는 GATE.IO (GATE.IO) 웹 버전의 등록 프로세스와 GATE 트레이딩 앱의 등록 프로세스를 소개합니다. 웹 등록 또는 앱 등록이든, 공식 웹 사이트 또는 App Store를 방문하여 Genuine 앱을 다운로드 한 다음 사용자 이름, 암호, 이메일, 휴대 전화 번호 및 기타 정보, 완전한 이메일 또는 휴대 전화 확인을 작성해야합니다.

Bybit Exchange 링크를 직접 다운로드하고 설치할 수없는 이유는 무엇입니까? Feb 21, 2025 pm 10:57 PM

Bybit Exchange 링크를 직접 다운로드하고 설치할 수없는 이유는 무엇입니까? Bybit은 사용자에게 거래 서비스를 제공하는 암호 화폐 거래소입니다. Exchange의 모바일 앱은 다음과 같은 이유로 AppStore 또는 GooglePlay를 통해 직접 다운로드 할 수 없습니다. 1. App Store Policy는 Apple과 Google이 App Store에서 허용되는 응용 프로그램 유형에 대한 엄격한 요구 사항을 갖지 않도록 제한합니다. Cryptocurrency Exchange 응용 프로그램은 금융 서비스가 포함되며 특정 규정 및 보안 표준이 필요하기 때문에 이러한 요구 사항을 충족하지 않습니다. 2. 법률 및 규정 준수 준수 많은 국가에서 암호 화폐 거래와 관련된 활동이 규제되거나 제한됩니다. 이러한 규정을 준수하기 위해 BYBIT 응용 프로그램은 공식 웹 사이트 또는 기타 공인 채널을 통해서만 사용할 수 있습니다.

참깨 오픈 도어 트레이딩 플랫폼 다운로드 모바일 버전 게이트 오리오 트레이딩 플랫폼 다운로드 주소 Feb 28, 2025 am 10:51 AM

앱을 다운로드하고 계정의 안전을 보장하기 위해 공식 채널을 선택하는 것이 중요합니다.

Crypto Digital Asset Trading App (2025 Global Ranking)에 권장되는 상위 10 개 Mar 18, 2025 pm 12:15 PM

이 기사에서는 Binance, OKX, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, Bydfi 및 Xbit DencentRalized Exchanges를 포함하여주의를 기울여야 할 상위 10 개의 Cryptocurrency 거래 플랫폼을 권장합니다. 이 플랫폼은 거래 통화 수량, 거래 유형, 보안, 규정 준수 및 특수 기능 측면에서 고유 한 이점이 있습니다. 예를 들어 Binance는 전 세계 최대의 거래량과 풍부한 기능으로 유명합니다. 적절한 플랫폼을 선택하려면 자체 거래 경험, 위험 허용 범위 및 투자 선호도를 기반으로 포괄적 인 고려 사항이 필요합니다. 이 기사가 자신에게 가장 적합한 것을 찾는 데 도움이되기를 바랍니다.

Binance Binance 공식 웹 사이트 최신 버전 로그인 포털 Feb 21, 2025 pm 05:42 PM

Binance 웹 사이트 로그인 포털의 최신 버전에 액세스하려면 다음을 수행하십시오. 공식 웹 사이트로 이동하여 오른쪽 상단의 "로그인"버튼을 클릭하십시오. 기존 로그인 방법을 선택하십시오. 새 사용자 인 경우 "등록하십시오. 등록 된 휴대폰 번호 또는 이메일 및 비밀번호를 입력하고 완전한 인증 (예 : 모바일 확인 코드 또는 Google 인증 자). 성공적인 확인 후 Binance 공식 웹 사이트 로그인 포털의 최신 버전에 액세스 할 수 있습니다.

2025 년 Bitget의 최신 다운로드 주소 : 공식 앱을 얻는 단계 Feb 25, 2025 pm 02:54 PM

이 안내서는 Android 및 iOS 시스템에 적합한 공식 Bitget Exchange 앱에 대한 자세한 다운로드 및 설치 단계를 제공합니다. 이 안내서는 공식 웹 사이트, App Store 및 Google Play를 포함한 여러 권위있는 소스의 정보를 통합하고 다운로드 및 계정 관리 중 고려 사항을 강조합니다. 사용자는 App Store, 공식 웹 사이트 APK 다운로드 및 공식 웹 사이트 Jump, 완전한 등록, 신원 확인 및 보안 설정을 포함한 공식 채널에서 앱을 다운로드 할 수 있습니다. 또한 가이드는 자주 묻는 질문과 다음과 같은 고려 사항을 다룹니다.

See all articles

Google은 PaLM을 오픈소스로 제공하지 않지만 네티즌들은 이를 오픈소스로 제공합니다! 수천억 개의 매개변수의 미니어처 버전: 최대값은 10억 개, 8K 컨텍스트입니다.

Open Source PaLM

설치

Training

Data

PaLM 2 출시 예정

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제