LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！-人工智慧-PHP中文網

從位元組到萬物：突破邊界，朝向統一的數據建模進發

首頁

科技週邊

人工智慧

LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！

PHPz

Mar 13, 2024 pm 07:20 PM

模型訓練模擬器

微軟亞洲研究院推出的最新成果bGPT，這種基於位元組的Transformer模型，為我們探索數位世界開闢了新的大門。

與傳統基於詞表的語言模型不同，bGPT具有獨特之處，即其能夠直接處理原始二進位數據，不受特定格式或任務的限制。其旨在全面模擬數位世界，為模型的發展開啟了新的可能性。

LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！

論文：#https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

#程式碼：https://www.php.cn/link/359499f804ea7988921bf86c9377fb95

#模型：https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad

#計畫首頁：

LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！

##################################################################1 https://www.php.cn/link/71af59614c8b42af334933e9261e53be###############研究小組在他們的研究論文中展示了bGPT在建模方面的巨大潛力。透過進行位元組級處理，bGPT不僅能夠產生文字、影像和音頻，還能夠模擬電腦的行為，包括格式轉換演算法和CPU狀態的建模。這種將所有資料視為位元組序列的方法使得bGPT能夠將不同類型的資料整合到同一個框架中。 ############一經發布，bGPT的論文在X（Twitter）上引起了廣泛熱議，突顯了深度學習模式的潛在變革，為模型真正理解和模擬數字世界中的各種活動開啟了新可能性。 #########二進位資料：構成數位世界的基礎DNA#########二進位資料是數位世界的基石，它貫穿了電腦處理器以及我們日常使用的電子產品的操作系統，是所有資料、設備和軟體的核心。因此，基於這個基礎，bGPT的目標是透過研究二元資料序列來理解數位系統的內在邏輯，從而重塑和模擬各種複雜的數位現象。 ############bGPT透過位元組級的處理，不僅能應用於常規的AI生成和理解任務，還能處理更多的非傳統應用。例如，它能直接模擬MIDI——一種音樂傳輸和儲存的標準格式，這在先前的研究中由於MIDI的二進位本質而避免了直接建模。 ############但bGPT天生適合此類任務，能夠精確模擬音樂資料的轉換演算法，將ABC記譜法轉換為MIDI格式時，達到極低的錯誤率（0.0011 BPB）。 ############在實際應用中，bGPT通常能夠準確地完成ABC符號與MIDI檔案之間的轉換，有時甚至能修正原始檔案中的錯誤，使音樂轉換更加準確。 ##############################bGPT自動將ABC記譜法轉換成MIDI格式（上圖）與原始MIDI資料（下圖）的對比，凸顯了關鍵的差異：雖然原MIDI數據中漏掉了一拍（見下圖），導致和弦伴奏斷開，但由bGPT轉換的結果（見上圖）正確填補了這一缺失，確保了和弦伴奏的流暢性。 ############研究團隊也將CPU建模作為硬體行為模擬的代表性任務：此任務要求模型接收低階機器指令序列作為輸入，其目標是準確預測每個指令執行後CPU狀態如何更新，直到程式停止。 ############在這個任務中，bGPT展現出超過99.99%的準確率，顯示了位元組模型在處理原生二進位資料方面的強大能力和可擴展性。 ################

在提供了程式和初始CPU狀態的情況下，bGPT能夠準確地預測CPU執行的完整過程，直到程式終止。在這個範例中，bGPT精確地處理了所有CPU指令。為了便於理解，這裡將實際的位元組序列轉換成了更易讀的格式。

從位元組到萬物：突破邊界，朝向統一的數據建模進發

bGPT不僅能處理原生二進位數據，還能將多種數據類型融合進一個統一的模型架構中，視一切資料為位元組序列。

這種方法不僅簡化了資料建模流程，也使得從任何資料來源的整合變得輕而易舉，且無需為特定資料類型自訂模型。

研究團隊在論文中舉例了傳統文字、圖像及音訊文件，展現了bGPT在統一資料建模方面的能力。他們訓練的bGPT模型擁有約1億參數。

實驗結果表明，在與GPT-2（文字模型）、ViT（視覺模型）和AST（音訊模型）等同規模模型的比較中，bGPT在不同資料類型上均展現出了可媲美的性能。

bGPT在文字生成方面的表現非常出色。由於其位元組層級的文本編碼，該模型無需依賴詞彙表，從而支援所有語言。

它的分層Transformer架構，儘管計算開銷與GPT-2相近，卻能產生長達8KB的文本，大大超出了GPT-2的長度限制。在經過Wikipedia資料進行預訓練後，bGPT生成的文字在風格和主題上都與GPT-2不相上下，證明了其在文字生成方面的強大能力。

bGPT在Wikipedia資料集上進行預訓練，產生的文字範例品質和主題一致性與GPT-2相當。

bGPT可以透過預測影像位元組序列中的下一個位元組來產生影像。該模型在ImageNet資料集上進行了預訓練，生成的影像解析度為32x32像素。

雖然在當前規模下，透過位元組序列準確地捕捉影像的二維空間關係有所困難，導致生成的影像存在偽影和雜訊，但紋理和光影效果通常還是比較準確的。

此外，這些產生的影像均能被正常解碼為BMP檔。研究團隊指出，透過擴大bGPT的規模，類似OpenAI開發的iGPT在像素序列建模方面的方法，或許可以實現更高品質、更逼真的影像生成。

這些是由在ImageNet資料集上進行預訓練的bGPT所產生的一組影像。雖然影像的紋理和光影效果通常比較準確，但在這些生成的影像中辨識主要物體卻有一定難度。

bGPT將音訊資料視為位元組序列，能產生1秒長、取樣率為8000 Hz的音訊取樣。

該模型在LibriSpeech資料集上完成了預訓練，並進一步在Speech Commands v2資料集上進行微調和演示。 bGPT產生的音訊樣本保持了較高的準確度，其中一些樣本幾乎與真實音訊無法區分。以下是展示bGPT在音訊生成領域能力的範例集。

透過bGPT探索位元組構成的數字世界

#傳統語言模型，不管它們有多強大，主要專注於處理自然語言文本。 bGPT模型透過基於位元組的處理機制，打破了這種僅限於文字處理的局限性，開啟了一個全新的資料處理範疇。

這一進步讓bGPT有能力無縫地處理包括文字、圖像、音訊在內的各種數據類型，甚至能處理來自演算法和硬體的原生二進位數據，為全面模擬和理解數位世界鋪平了道路。

雖然bGPT展現出了引人注目的能力，但其在計算開銷方面的局限性，如當前在常規顯卡上僅能處理最大8KB的字節序列，對於那些需要產生或處理大量資料的應用來說，構成了明顯的限制。未來的工作計畫將集中在開發更有效率的演算法和利用硬體的進步上，旨在提高處理更大規模資料序列的能力。

全球的科技愛好者已經開始展望bGPT未來的潛力，從網路修剪和自我學習的優化到超大規模網路的自我重構能力，這些討論指向了一個共同的願景：bGPT最終可能實現一個統一的模型，能夠處理和輸出所有類型的位元組數據，真正成為數位世界的全面模擬器。

LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！

研究團隊已將bGPT的程式碼和模型開源。這意味著你可以在自己的資料集上直接訓練bGPT，無需做出任何模型架構上的調整，便可探索字節模型在數位領域的廣闊前景。

以上是LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1666

CakePHP 教程

1425

Laravel 教程

1325

PHP教程

1273

C# 教程

1252

Related knowledge

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下，一個人工智慧模型，不僅擁有超越傳統運算的能力，還能以更低的成本實現更有效率的效能。這不是科幻，DeepSeek-V2[1]，全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合（MoE）語言模型，具有訓練經濟、推理高效的特點。它由236B個參數組成，其中21B個參數用於啟動每個標記。與DeepSeek67B相比，DeepSeek-V2效能更強，同時節省了42.5%的訓練成本，減少了93.3%的KV緩存，最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

替代MLP的KAN，被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初，來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如，作者表示，他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說，DeepMind的MLP有大約300,000個參數，而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎，MLP基於通用逼近定理，而KAN基於Kolmogorov-Arnold表示定理。如下圖所示，KAN在邊上具

joiplay模擬器字體設定方法介紹 May 09, 2024 am 08:31 AM

jojplay模擬器其實可以自訂遊戲字體的，而且可以解決文字出現缺字、方框字的問題，想必不少玩家還不知道怎麼操作，下面小編就為大家帶來了joiplay模擬器字體設定方法介紹。 joiplay模擬器字體怎麼設定1、先開啟joiplay模擬器，點選右上角的設定（三個點），找到。 2.在RPGMSettings一欄，第三行CustomFont自訂字體，點選選擇。 3.選擇字體文件，點擊ok就行了，注意不要按右下角「儲存」圖標，不然會原預設設定。 4.推薦方正準圓簡體（已在復興、重生遊戲資料夾內）。 joi

特斯拉機器人進廠打工，馬斯克：手的自由度今年將達到22個！ May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐，已經可以在工廠裡打工了。正常速度下，它分揀電池（特斯拉的4680電池）是這樣的：官方還放出了20倍速下的樣子——在小小的「工位」上，揀啊揀啊揀：這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作，是完全自主的，全程沒有人為的干預。而且在Optimus的視角之下，它還可以把放歪了的電池重新撿起來放置，主打一個自動糾錯：對於Optimus的手，英偉達科學家JimFan給出了高度的評價：Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

雷電模擬器怎麼刪除應用？ -雷電模擬器刪除應用的方法？ May 08, 2024 pm 02:40 PM

雷電模擬器版本官方版是相當專業的安卓模擬器工具。那麼雷電模擬器要怎麼刪除應用？雷電模擬器刪除應用的方法？下面就讓小編給大家解答吧!雷電模擬器怎麼刪除應用？ 1、點擊並長按你想要刪除的應用程式圖示。 2、等待一段時間，直到出現卸載或刪除應用程式的選項。 3、將應用程式拖曳到卸載選項處。 4.在彈出的確認視窗中，點選確定就可以完成應用的刪除。

快手版Sora「可靈」開放測試：生成超120s視頻，更懂物理，複雜運動也能精準建模 Jun 11, 2024 am 09:51 AM

什麼？瘋狂動物城被國產AI搬進現實了？與影片一同曝光的，是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線，結合多項自研技術創新，生產的影片不僅運動幅度大且合理，還能模擬物理世界特性，具備強大的概念組合能力與想像。數據上看，可靈支持生成長達2分鐘的30fps的超長視頻，分辨率高達1080p，且支援多種寬高比。另外再劃個重點，可靈不是實驗室放出的Demo或影片結果演示，而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實，不開空頭支票、發布即上線，可靈大模型已在快影

人生重開模擬器攻略大全 May 07, 2024 pm 05:28 PM

人生重開模擬器是一款非常有趣的模擬小遊戲，這款遊戲最近非常的火，遊戲中有很多的玩法，下面小編就大家帶來了人生重開模擬器攻略大全，快來看看都有哪些攻略吧。人生重開模擬器攻略大全人生重開模擬器特色這是一款非常有創意的遊戲，遊戲裡玩家可以依照自己的想法進行遊戲。每天都會有許多的任務可以完成，在這個虛擬的世界裡享受全新的人生。遊戲裡擁有許多的歌曲，各種不同的人生等著你來感受。人生重開模擬器遊戲內容天賦抽卡：天賦：必選神秘的小盒子，才能修仙子。各種各樣的小膠囊可選，避免中途死掉。克蘇魯選了可能會

全面超越DPO：陳丹琦團隊提出簡單偏好優化SimPO，也煉出最強8B開源模型 Jun 01, 2024 pm 04:41 PM

為了將大型語言模型（LLM）與人類的價值和意圖對齊，學習人類回饋至關重要，這能確保它們是有用的、誠實的和無害的。在對齊LLM方面，一種有效的方法是根據人類回饋的強化學習（RLHF）。儘管RLHF方法的結果很出色，但其中涉及了一些優化難題。其中涉及訓練一個獎勵模型，然後優化一個策略模型來最大化該獎勵。近段時間已有一些研究者探索了更簡單的離線演算法，其中之一就是直接偏好優化（DPO）。 DPO是透過參數化RLHF中的獎勵函數來直接根據偏好資料學習策略模型，這樣就無需顯示式的獎勵模型了。此方法簡單穩定

See all articles

LLM將成歷史？開源bGPT或顛覆深度學習範式：直接模擬二進制，開啟類比數位世界新紀元！

從位元組到萬物：突破邊界，朝向統一的數據建模進發

透過bGPT探索位元組構成的數字世界

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題