Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文-人工智慧-PHP中文網

開源PaLM

安裝" >安裝

使用" >使用

訓練" >訓練

資料" >資料

PaLM 2要來了

首頁

科技週邊

人工智慧

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

王林

May 28, 2023 pm 09:40 PM

Google 開源

Google未開源的PaLM，網友竟給開源了。

昨天，一位開發者在GitHub上開源了三種微縮版的PaLM模型：參數分別為1.5億（PalM-150m），4.1億（PalM-410m）和10億（PalM-1b）。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

計畫網址：https://github.com/conceptofmind/PaLM

這三種模型在GoogleC4資料集進行了訓練，上下文長度為8k。未來，還有20億參數的模型正在訓練中。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

#GoogleC4資料集

開源PaLM

使用4.1億參數模型產生的範例:

My dog is very cute, but not very good at socializing with other dogs. The dog loves all new people and he likes to hang out with other dogs . I do need to take him to the park with other dogs. He does have some bad puppy breath, but it is only when he runs off in a direction he doesn't want to go. currently my off in a direction he doesn't want to go. currently my verydog isbeing he doesn . would like to say hi in the park, but would rather take great care of himself for a while. He also has bad breath. I am going to have to get him some oral braces. It's been 3 months. The dog has some biting pains around his mouth. The dog is very timid and scared. The dog gets aggressive towards people. The dog is very playful and they are a little spoiled. I am not sure if it's a dog thing or if . and just wants to play. He plays with his toys all the time and even goes on walks. He is a little picky, not very good with other dogs. The dog is just a little puppy that goes to the park. He is a super friendly dog. He has not had a bad mouth or bad breath

#我的狗很可愛，但是不善於和其他狗交際。這隻狗喜歡所有新來的人，他喜歡和其他的狗一起玩。我確實需要帶他和其他狗一起去公園。他確實有點小狗的口臭，但只有當他往不想去的方向跑的時候。現在我的狗很淘氣。他想在公園打個招呼，但寧願好好照顧自己一段時間。他還有口臭。我得給他買口腔矯正器，已經過了三個月。這條狗狗嘴邊有些咬痕疼痛。這隻狗非常膽小和害怕。這隻狗非常頑皮，他們有點被寵壞了。我不確定是狗的問題還是他被寵壞了。他喜歡他的玩具，只是想玩。他總是玩他的玩具，甚至去散步。他有點挑剔，不太會和其他狗相處。那隻狗隻是一隻去公園的小狗。它是一隻超級友善的狗。他沒有口臭問題了。

雖然參數確實有點少，但這產生的效果還是有些一言難盡…

這些模型相容於許多Lucidrain的流行倉庫，例如Toolformer-pytorch 、PalM-rlhf-pytorch和PalM-pytorch。

最新開源的三種模型都是基準模型，並將在更大規模資料集上進行訓練。

所有的模型將在FLAN上進一步調整指令，以提供flan-PaLM模型。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

開源的PaLM模型透過Flash Attention、 Xpos Rotary Embeddings進行訓練，從而實現了更好的長度外推，並使用多查詢單鍵值注意力機制進行更有效率的解碼。

在最佳化演算法方面，採用的則是解耦權重衰減Adam W，但也可以選擇使用Mitchell Wortsman的Stable Adam W。

目前，模型已經上傳到Torch hub，檔案也儲存在Huggingface hub中。

如果模型無法從Torch hub正確下載，請務必清除 .cache/torch/hub/ 中的檢查點和模型資料夾。如果問題仍未解決，那麼你可以從Huggingface的倉庫下載檔案。目前，Huggingface 的整合工作正在進行中。

所有的訓練資料都已經用GPTNEOX標記器進行了預標記，並且序列長度被截止到8192。這將有助於節省預處理資料的大量成本。

這些資料集已經以parquet格式儲存在Huggingface上，你可以在這裡找到各個資料區塊：C4 Chunk 1，C4 Chunk 2，C4 Chunk 3，C4 Chunk 4，以及C4 Chunk 5。

在分散式訓練腳本中還有另一個選項，不使用提供的預標記C4資料集，而是載入和處理另一個資料集，如 openwebtext。

安裝

在嘗試執行模型之前，需要先進行一波安裝。

<code>git clone https://github.com/conceptofmind/PaLM.gitcd PaLM/pip3 install -r requirements.txt</code>

登入後複製

使用

你可以透過使用Torch hub載入預訓練的模型進行額外的訓練或微調：

<code>model = torch.hub.load("conceptofmind/PaLM", "palm_410m_8k_v0").cuda()</code>

登入後複製

另外，你還可以通下面的方式直接載入PyTorch模型檢查點：

<code>from palm_rlhf_pytorch import PaLMmodel = PaLM(num_tokens=50304, dim=1024, depth=24, dim_head=128, heads=8, flash_attn=True, qk_rmsnorm = False,).cuda()model.load('/palm_410m_8k_v0.pt')</code>

登入後複製

要使用模型產生文本，可以使用命令列:

prompt-用於產生文字的提示。

seq _ len-產生文字的序列長度，預設值為256。

temperature-取樣溫度，預設為0.8

#filter_thres-用於取樣的濾波器閾值。預設值為0.9。

model-用於產生的模型。有三種不同的參數（150m，410m，1b）：palm_150m_8k_v0，palm_410m_8k_v0，palm_1b_8k_v0。

<code>python3 inference.py "My dog is very cute" --seq_len 256 --temperature 0.8 --filter_thres 0.9 --model "palm_410m_8k_v0"</code>

登入後複製

為了提升效能，推理使用torch.compile()、 Flash Attention和Hidet。

如果你想透過添加流處理或其他功能來擴展生成，作者提供了一個通用的推理腳本「inference.py」。

訓練

這幾個「開源PalM」模型是在64個A100（80GB）GPU上完成訓練的。

為了方便模型的訓練，作者也提供了一個分散式訓練腳本train_distributed.py。

你可以自由改變模型層和超參數配置以滿足硬體的要求，並且還可以載入模型的權重並改變訓練腳本來微調模型。

最後，作者表示將來會加入一個具體的微調腳本，並對LoRA進行探索。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

資料

#可以透過執行build_dataset.py腳本，以類似於訓練期間使用的C4資料集的方式預處理不同的資料集。這將對資料進行預先標記，將資料分成指定序列長度的區塊，並上傳到Huggingface hub。

例如：

<code>python3 build_dataset.py --seed 42 --seq_len 8192 --hf_account "your_hf_account" --tokenizer "EleutherAI/gpt-neox-20b" --dataset_name "EleutherAI/the_pile_deduplicated"</code>

登入後複製

PaLM 2要來了

2022年4月，Google首次官宣了5400億參數的PaLM。與其他LLM一樣，PaLM能執行各種文字產生和編輯任務。

PaLM是Google首次大規模使用Pathways系統將訓練擴展到6144塊晶片，這是迄今為止用於訓練的基於TPU的最大系統配置。

它的理解能力拔群，不只連笑話都能看懂，還能給看不懂的你解釋笑點在哪。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

就在3月中，Google首次開放其PaLM大型語言模型API。

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

這意味著，人們可以用它來完成總結文字、寫程式碼等任務，甚至是將PaLM訓練成一個像ChatGPT一樣的對話聊天機器人。

在即將召開的Google年度I/O大會上，劈柴將公佈公司在AI領域的最新發展。

據稱，最新、最先進的大型語言模型PaLM 2即將推出。

PaLM 2包含100多種語言，並一直在內部代號「統一語言模型」（Unified Language Model）下運作。它還進行了廣泛的編碼和數學測試以及創意寫作。

上個月，Google表示，其醫學LLM「Med-PalM2」，可以回答醫學考試的問題，在「專家醫生層級」，準確率為85% 。

此外，Google還將發布大模型加持下的聊天機器人Bard，以及搜尋的生成式體驗。

最新AI發布能否讓Google挺直腰板，還得拭目以待。

以上是Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1665

CakePHP 教程

1424

Laravel 教程

1322

PHP教程

1270

C# 教程

1249

Related knowledge

加密數字資產交易APP推薦top10（2025全球排名） Mar 18, 2025 pm 12:15 PM

本文推荐十大值得关注的加密货币交易平台，涵盖币安(Binance)、OKX、Gate.io、BitFlyer、KuCoin、Bybit、Coinbase Pro、Kraken、BYDFi和XBIT去中心化交易所。这些平台在交易币种数量、交易类型、安全性、合规性、特色功能等方面各有千秋，例如币安以其全球最大的交易量和丰富的功能著称，而BitFlyer则凭借其日本金融厅牌照和高安全性吸引亚洲用户。选择合适的平台需要根据自身交易经验、风险承受能力和投资偏好进行综合考量。希望本文能帮助您找到最适合自

歐易okex賬號怎麼註冊、使用、註銷教程 Mar 31, 2025 pm 04:21 PM

本文詳細介紹了歐易OKEx賬號的註冊、使用和註銷流程。註冊需下載APP，輸入手機號或郵箱註冊，完成實名認證。使用方面涵蓋登錄、充值提現、交易以及安全設置等操作步驟。而註銷賬號則需要聯繫歐易OKEx客服，提供必要信息並等待處理，最終獲得賬號註銷確認。通過本文，用戶可以輕鬆掌握歐易OKEx賬號的完整生命週期管理，安全便捷地進行數字資產交易。

binance怎麼註冊詳細教程（2025新手指南） Mar 18, 2025 pm 01:57 PM

本文提供Binance幣安註冊及安全設置的完整指南，涵蓋註冊前的準備工作（包括設備、郵箱、手機號及身份證明文件準備），詳細介紹了官網及APP兩種註冊方式，以及不同級別的身份驗證（KYC）流程。此外，文章還重點講解瞭如何設置資金密碼、開啟雙重驗證（2FA，包括谷歌身份驗證器和短信驗證）以及設置防釣魚碼等關鍵安全步驟，幫助用戶安全便捷地註冊和使用Binance幣安平台進行加密貨幣交易。請務必在交易前了解相關法律法規及市場風險，謹慎投資。

如何優化jieba分詞以改善景區評論的關鍵詞提取效果？ Apr 01, 2025 pm 06:24 PM

如何優化jieba分詞以改善景區評論的關鍵詞提取？在使用jieba分詞處理景區評論數據時，如果發現分詞結果不理�...

gate.io手機app使用教程 Mar 26, 2025 pm 05:15 PM

gate.io手機app使用教程：1、安卓用戶，訪問 Gate.io 官方網站，下載安卓安裝包，您可能需要在手機設置中允許安裝來自未知來源的應用；2、ios用戶，在 App Store 中搜索 "Gate.io" 下載。

虛擬幣最老的幣排行榜最新更新 Apr 22, 2025 am 07:18 AM

虛擬貨幣“最老”排行榜如下：1. 比特幣（BTC），發行於2009年1月3日，是首個去中心化數字貨幣。 2. 萊特幣（LTC），發行於2011年10月7日，被稱為“比特幣的輕量版”。 3. 瑞波幣（XRP），發行於2011年，專為跨境支付設計。 4. 狗狗幣（DOGE），發行於2013年12月6日，基於萊特幣代碼的“迷因幣”。 5. 以太坊（ETH），發行於2015年7月30日，首個支持智能合約的平台。 6. 泰達幣（USDT），發行於2014年，是首個與美元1:1錨定的穩定幣。 7. 艾達幣（ADA），發

okex交易平台官網登錄入口 Mar 18, 2025 pm 12:42 PM

本文詳細介紹了歐易OKEx網頁版登錄的完整步驟，包括準備工作（確保網絡連接穩定及瀏覽器更新）、訪問官網（注意網址準確性，避免釣魚網站）、找到登錄入口（點擊官網首頁右上角的“登錄”按鈕）、輸入登錄信息（郵箱/手機號及密碼，支持驗證碼登錄）、完成安全驗證（滑動驗證、谷歌驗證或短信驗證）等五個步驟，最終成功登錄後即可進行數字資產交易等操作。安全便捷的登錄流程，保障用戶資產安全。

虛擬幣購買app安全靠譜的top10推薦 Mar 18, 2025 pm 12:12 PM

2025年全球虛擬幣交易平台Top 10推薦，助您玩轉數字貨幣市場！本文將為您深度解析幣安(Binance)、OKX、Gate.io、BitFlyer、KuCoin、Bybit、Coinbase Pro、Kraken、BYDFi和XBIT去中心化交易所等十家頂級平台的核心優勢和特色功能。無論是追求高流動性、豐富的交易類型，還是注重安全合規、創新功能，都能在此找到適合您的平台。我們將從交易品種、安全性、特色功能等方面進行全面對比，助您選擇最合適的虛擬貨幣交易平台，把握2025年數字貨幣投資機遇

See all articles

Google沒開源的PaLM，網友給開源了！千億參數微縮版：最大隻有10億，8k上下文

開源PaLM

安裝

使用

訓練

資料

PaLM 2要來了

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題