目次
バイナリ データは、コンピュータ プロセッサと電子機器の動作を通じて実行されるデジタル世界の基礎です。私たちが毎日使用する製品 システムは、すべてのデータ、機器、ソフトウェアの中核です。したがって、この基盤に基づいて、bGPT の目標は、バイナリ データ シーケンスを研究することによってデジタル システムの内部ロジックを理解し、それによってさまざまな複雑なデジタル現象を再構成してシミュレーションすることです。
バイトからすべてへ: 境界を突破し、統合データ モデリングへ移行
ホームページ テクノロジー周辺機器 AI LLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。

LLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。

Mar 13, 2024 pm 07:20 PM
モデル 電車 エミュレータ

Microsoft Research Asia によって発表された最新の成果 bGPT、このバイトベースの Transformer モデルは、デジタル世界を探索するための新しい扉を開きます。

従来の語彙ベースの言語モデルとは異なり、bGPT は、特定の形式やタスクに制限されることなく、生のバイナリ データを直接処理できるという点で独特です。デジタル世界を完全にシミュレートし、モデル開発の新たな可能性を開くことを目的としています。

LLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。

#論文: #https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

コード:

https://www.php.cn/link/359499f804ea7988921bf86c9377fb95モデル:

https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad プロジェクトのホームページ:

https ://www.php.cn/link/71af59614c8b42af334933e9261e53be研究チームは、研究論文の中で、モデリングにおける bGPT の大きな可能性を実証しました。バイトレベルの処理を実行することにより、bGPT はテキスト、画像、オーディオを生成するだけでなく、フォーマット変換アルゴリズムや CPU 状態のモデリングなど、コンピューターの動作をシミュレートすることもできます。すべてのデータをバイトのシーケンスとして扱うこのアプローチにより、bGPT は異なるタイプのデータを同じフレームワークに統合できます。

bGPT の論文は公開されると、この活動が新たな可能性を開くということで広範な議論を引き起こしました。

バイナリ データ: デジタル世界を構成する基本 DNA

バイナリ データは、コンピュータ プロセッサと電子機器の動作を通じて実行されるデジタル世界の基礎です。私たちが毎日使用する製品 システムは、すべてのデータ、機器、ソフトウェアの中核です。したがって、この基盤に基づいて、bGPT の目標は、バイナリ データ シーケンスを研究することによってデジタル システムの内部ロジックを理解し、それによってさまざまな複雑なデジタル現象を再構成してシミュレーションすることです。

bGPT は、従来の AI 生成やバイトレベルの処理によるタスクの理解に適用できるだけでなく、より非従来的なアプリケーションも処理できます。たとえば、音楽の送信と保存のための標準フォーマットである MIDI を直接シミュレートできますが、これまでの研究では MIDI のバイナリ特性により直接モデリングが避けられてきました。

しかし、bGPT は音楽データの変換アルゴリズムを正確にシミュレートし、ABC 記譜法を MIDI 形式に変換する際の非常に低いエラー率 (0.0011 BPB) を達成することができます。 。

実際のアプリケーションでは、bGPT は通常、ABC シンボルと MIDI ファイル間の変換を正確に完了することができ、場合によっては元のファイルのエラーを修正して音楽変換をより正確にすることもできます。

LLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。


bGPT は、ABC 記譜法を MIDI 形式 (上記) と元の MIDI データ ( の比較) に自動的に変換します。下の図) は重要な違いを強調しています。元の MIDI データ (下の図を参照) ではビートが欠落しており、コード伴奏が切断されていますが、bGPT 変換の結果 (上の図を参照) では、この欠落部分が正しく埋められています。 、コード伴奏の滑らかさを確保します。

研究チームは、CPU モデリングもハードウェア動作シミュレーションの代表的なタスクであると考えています。このタスクでは、モデルが一連の低レベル機械命令を入力として受け取る必要があり、その目標は各命令の実行を正確に予測するためのプログラムを停止するまでの CPU ステータスの更新方法。

このタスクでは、bGPT は 99.99% 以上の精度を示し、ネイティブ バイナリ データの処理におけるバイト モデルの能力とスケーラビリティを実証しました。

プログラムと初期 CPU 状態が与えられると、bGPT はプログラムが終了するまでの CPU 実行の完全なプロセスを正確に予測できます。この例では、bGPT はすべての CPU 命令を正確に処理します。理解を容易にするために、実際のバイト シーケンスは、より読みやすい形式に変換されます。

バイトからすべてへ: 境界を突破し、統合データ モデリングへ移行

bGPT は、ネイティブ バイナリ データを処理できるだけでなく、複数のデータ タイプを統合して統合することもできます。モデル アーキテクチャでは、すべてのデータはバイト シーケンスとみなされます。

このアプローチにより、データ モデリング プロセスが簡素化されるだけでなく、特定のデータ型に合わせてモデルをカスタマイズする必要がなく、あらゆるデータ ソースからの統合が簡単になります。

研究チームは論文の中で従来のテキスト、画像、音声ファイルの例を挙げ、統合データモデリングにおけるbGPTの機能を実証しました。彼らがトレーニングした bGPT モデルには約 1 億個のパラメータがあります。

実験結果は、GPT-2 (テキスト モデル)、ViT (ビジュアル モデル)、AST (オーディオ モデル) と同じスケールのモデルと比較して、bGPT は異なるモデルでより優れたパフォーマンスを発揮することを示しています。データ型 どちらも同等のパフォーマンスを示しました。

bGPT はテキスト生成において非常に優れたパフォーマンスを発揮します。バイトレベルのテキストエンコーディングのおかげで、このモデルは語彙に依存しないため、すべての言語をサポートできます。

その階層型 Transformer アーキテクチャでは、計算オーバーヘッドは GPT-2 と同様ですが、最大 8KB のテキストを生成できます。これは GPT-2 の長さ制限を大幅に超えています。 Wikipedia データで事前トレーニングした後、bGPT によって生成されたテキストはスタイルとトピックの両方で GPT-2 に匹敵し、テキスト生成におけるその強力な能力が証明されました。

bGPT は Wikipedia データセットで事前トレーニングされており、生成されたテキスト サンプルの品質とトピックの一貫性は GPT-2 に匹敵します。

bGPT は、一連の画像バイトの次のバイトを予測することで画像を生成できます。モデルは ImageNet データセットで事前トレーニングされており、生成された画像の解像度は 32x32 ピクセルです。

現在のスケールではありますが、バイト シーケンスを通じて画像の 2 次元の空間関係を正確にキャプチャすることは困難であり、生成された画像、テクスチャ、光にアーティファクトやノイズが発生します。また、シャドウ効果は通常、まだ比較的正確です。

さらに、これらの生成された画像は通常どおり BMP ファイルにデコードできます。研究チームは、OpenAIが開発したiGPTのピクセルシーケンスモデリング手法と同様に、bGPTの規模を拡大することで、より高品質でよりリアルな画像生成が実現できる可能性があると指摘しました。

これらは、ImageNet データセットで事前トレーニングされた bGPT によって生成された一連の画像です。画像のテクスチャと照明効果は一般に正確ですが、生成された画像内の主なオブジェクトを識別するのは困難な場合があります。

bGPT はオーディオ データをバイトのシーケンスとして扱い、8000 Hz のサンプリング レートで 1 秒の長さのオーディオ サンプルを生成できます。

モデルは LibriSpeech データ セットで事前トレーニングされ、さらに微調整され、Speech Commands v2 データ セットで実証されました。 bGPT によって生成されたオーディオ サンプルは高レベルの精度を維持しており、一部のサンプルは実際のオーディオとほとんど区別できません。以下は、オーディオ生成の分野における bGPT の機能を示す一連の例です。

bGPT でバイトのデジタル世界を探索する

従来の言語モデルは、どれほど強力であっても、主に自然言語テキストの処理に焦点を当てています。 。 bGPT モデルは、バイトベースの処理メカニズムを通じてテキスト処理の制限を打ち破り、新しいデータ処理カテゴリを切り開きます。

この進歩により、bGPT は、テキスト、画像、オーディオ、さらにはアルゴリズムやハードウェアからのネイティブ バイナリ データを含むさまざまなデータ タイプをシームレスに処理できるようになり、完全にシミュレーションおよび実行する道が開かれます。デジタルの世界を理解する。

bGPT は魅力的な機能を実証していますが、計算オーバーヘッドの点で制限があります。たとえば、現在、従来のグラフィック カードでは最大 8KB のバイト シーケンスしか処理できません。これは明らかな問題を引き起こします。大量のデータを生成または処理する必要があるアプリケーションの制限。今後の作業計画は、より効率的なアルゴリズムの開発とハードウェアの進歩の活用に焦点を当て、より大きなデータシーケンスを処理する能力の向上を目指します。

世界中のテクノロジー愛好家は、ネットワーク プルーニングと自己学習の最適化から、超大規模ネットワークの自己再構築機能に至るまで、bGPT の将来の可能性に期待し始めています。これらの議論は共通のビジョンを示しています。bGPT は最終的に、あらゆる種類のバイト データを処理および出力できる統合モデルを実現し、真にデジタル世界の包括的なシミュレーターになる可能性があります。

LLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。

研究チームは、bGPT のコードとモデルをオープンソース化しました。これは、モデル アーキテクチャを調整せずに、独自のデータ セットで bGPT を直接トレーニングし、デジタル分野におけるバイト モデルの幅広い可能性を探ることができることを意味します。

以上がLLMは歴史になるでしょうか?オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログ デジタル世界の新時代を切り開きます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

joiplayシミュレーターの使い方を紹介 joiplayシミュレーターの使い方を紹介 May 04, 2024 pm 06:40 PM

jojplay シミュレータは、非常に使いやすい携帯電話シミュレータです。携帯電話で実行できるコンピュータ ゲームをサポートしており、一部のプレイヤーはその使い方を知りません。以下のエディタでその使い方を紹介します。 。 Joiplay シミュレーターの使用方法 1. まず、Joiplay 本体と RPGM プラグインをダウンロードする必要があります。本体、プラグインの順にインストールするのが最適です。apk パッケージは、Joiplay バー (クリック) で入手できます。 >>>)を取得します。 2. Android が完成したら、左下隅にゲームを追加できます。 3. 適当に名前を入力し、実行ファイルの選択を押してゲームの game.exe ファイルを選択します。 4. アイコンは空白のままにすることも、お気に入りの画像を選択することもできます。

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです 世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました Jun 01, 2024 pm 10:03 PM

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

ライフ リスタート シミュレーター ガイド ライフ リスタート シミュレーター ガイド May 07, 2024 pm 05:28 PM

Life Restart Simulator は非常に興味深いシミュレーション ゲームです。このゲームにはさまざまな方法があります。以下に、Life Restart Simulator の完全なガイドを示します。戦略はあるのか?ライフ リスタート シミュレーター ガイド ガイド ライフ リスタート シミュレーターの特徴 プレイヤーが自由な発想で遊べる、非常にクリエイティブなゲームです。毎日完了すべきタスクがたくさんあり、この仮想世界で新しい生活を楽しむことができます。ゲーム内にはたくさんの曲があり、さまざまな人生があなたを待っています。ライフ リスタート シミュレーター ゲーム内容 才能カード抽選: 才能: 不滅になるためには、神秘的な小箱を選択する必要があります。途中で死んでしまうことを避けるために、さまざまな小さなカプセルが用意されています。クトゥルフは選ぶかもしれない

Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Jun 11, 2024 am 09:51 AM

何?ズートピアは国産AIによって実現するのか?ビデオとともに公開されたのは、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルです。 Sora も同様の技術的ルートを使用し、自社開発の技術革新を多数組み合わせて、大きく合理的な動きをするだけでなく、物理世界の特性をシミュレートし、強力な概念的結合能力と想像力を備えたビデオを制作します。データによると、Keling は、最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。もう 1 つの重要な点は、Keling は研究所が公開したデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションであるということです。さらに、主な焦点は実用的であり、白紙小切手を書かず、リリースされたらすぐにオンラインに移行することです。Ke Ling の大型モデルは Kuaiying でリリースされました。

アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

joiplayシミュレーターのフォント設定方法の紹介 joiplayシミュレーターのフォント設定方法の紹介 May 09, 2024 am 08:31 AM

jojplay シミュレーターは実際にゲームのフォントをカスタマイズすることができ、テキスト内の文字抜けや囲み文字の問題を解決できます。おそらく、多くのプレイヤーは操作方法を知らないと思います。次のエディターは、その設定方法を提供します。 jojplayシミュレータのフォントを紹介します。 joiplay シミュレーターのフォントを設定する方法 1. まず、joiplay シミュレーターを開き、右上隅にある設定 (3 つの点) をクリックして見つけます。 2. [RPGMSettings] 列で、3 行目の CustomFont カスタム フォントをクリックして選択します。 3. フォント ファイルを選択し、[OK] をクリックします。右下隅の [保存] アイコンをクリックしないように注意してください。クリックしないと、デフォルト設定が復元されます。 4. 創始者および準元の簡体字中国語文字が推奨されます (ゲーム Fuxing および Rebirth のフォルダにすでに入っています)。攘夷

テスラのロボットは工場で働く、マスク氏:手の自由度は今年22に達する! テスラのロボットは工場で働く、マスク氏:手の自由度は今年22に達する! May 06, 2024 pm 04:13 PM

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行​​い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

See all articles