


ChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われています
Meta モデルに基づく ChatGPT の軽量バージョンはここにありますか?
Meta が LLaMA の立ち上げを発表してからわずか 3 日後、LLaMA を ChatGPT に変換したオープンソースのトレーニング手法が業界に登場し、トレーニング速度が ChatGPT よりも最大 15 倍速いと主張しました。
LLaMA は Meta 社が開発した超高速かつ超小型の GPT-3 で、パラメータ数は後者の 10% に過ぎず、実行に必要な GPU は 1 つだけです。
これを ChatGPT に変換する手法は ChatLLaMA と呼ばれ、RLHF (ヒューマン フィードバックに基づく強化学習) に基づいてトレーニングされ、インターネットで急速に普及しました。
Meta の ChatGPT のオープンソース バージョンは本当に登場するのでしょうか?
ちょっと待ってください、物事はそれほど単純ではありません。
LLaMA を ChatGPT の「オープンソース メソッド」にトレーニングする
ChatLLaMA プロジェクトのホームページをクリックすると、実際には 4 つの部分 (
DeepSpeed、RLHF メソッド、LLaMA) が統合されていることがわかります。 LangChain エージェントに基づいて生成されたデータ セット。
その中で、DeepSpeed はオープンソースの深層学習トレーニング最適化ライブラリであり、大規模モデルのトレーニング機能を向上させるために使用される Zero と呼ばれる既存の最適化技術が含まれており、具体的にはモデルのトレーニング向上を支援することを指します。速度、コストの削減、モデルの可用性の向上など。
RLHF は報酬モデルを使用して、事前トレーニングされたモデルを微調整します。報酬モデルは、最初に複数のモデルを使用して質問と回答を生成し、次に質問と回答の手動並べ替えに依存してスコアリングを学習します。次に、報酬学習に基づいてモデルによって生成された回答をスコアリングし、強化学習によるモデルの機能。
LangChain は、さまざまな大規模言語モデルを統合し、他の知識ソースやコンピューティング機能と組み合わせた実用的なアプリケーションを作成することを目的とした大規模言語モデル アプリケーション開発ライブラリです。 LangChainエージェントはGPT-3の思考プロセス全体を思考連鎖のように公開し、操作を記録します。
この時点で、最も重要なのはやはり LLaMA モデルの重みであることがわかります。それはどこから来たのですか?
ねえ、Meta にアクセスして自分で申請してください。ChatLLaMA はそれを提供しません。 (Meta は LLaMA をオープンソースだと主張していますが、それでも申請する必要があります)
したがって、本質的に、ChatLLaMA はオープンソースの ChatGPT プロジェクトではなく、LLaMA に基づく単なるトレーニング方法です。そのライブラリに統合されているいくつかのプロジェクトは、もともとオープンソースでした。
実際、ChatLLaMA は Meta によって構築されたものではなく、Nebuly AI という新興 AI 企業によって構築されました。
Nebuly AI は、AI システムのパフォーマンスを向上させるための一連のプラグ アンド プレイ最適化モジュールを統合する、Nebullvm と呼ばれるオープン ソース ライブラリを作成しました。
たとえば、現在 Nebullvm に含まれているモジュールには、DeepMind のオープン ソース AlphaTensor アルゴリズムに基づく OpenAlphaTensor、ハードウェアを自動的に感知して高速化する最適化モジュールなどがあります。
##ChatLLaMA もこのシリーズのモジュールに含まれていますが、そのオープンソース ライセンスは市販されていないことに注意してください。したがって、「国内自社開発 ChatGPT」を直接使用したい場合は、それほど単純ではないかもしれません (doge)。
このプロジェクトを読んだ後、一部のネチズンは、誰かが本当に LLaMA のモデル重み (コード) を取得できたら素晴らしいのにと言いました...
しかし、一部のネチズンは、「ChatGPT トレーニング メソッドより 15 倍速い」という記述はまったくの誤解を招くものであると指摘しました。このネチズンは、ライブラリにある trlx と呼ばれる RLHF トレーニング方法よりも優れた RLHF トレーニング方法も推奨しています。トレーニング速度は通常の RLHF 方法よりも速いです。 . 3 ~ 4 回:
ChatLLaMA アドレス:
参考リンク: https://www.php.cn/link/fe27f92b1e3f4997567807f38d567a35
以上がChatGPT トレーニング メソッドの軽量バージョンはオープンソースです。 LLaMA を中心にわずか 3 日で構築され、トレーニング速度は OpenAI よりも 15 倍速いと言われていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

ブルー スクリーン コード 0x0000001 の対処法。ブルー スクリーン エラーは、コンピューター システムまたはハードウェアに問題がある場合の警告メカニズムです。コード 0x0000001 は、通常、ハードウェアまたはドライバーの障害を示します。ユーザーは、コンピュータの使用中に突然ブルー スクリーン エラーに遭遇すると、パニックになり途方に暮れるかもしれません。幸いなことに、ほとんどのブルー スクリーン エラーは、いくつかの簡単な手順でトラブルシューティングして対処できます。この記事では、ブルー スクリーン エラー コード 0x0000001 を解決するいくつかの方法を読者に紹介します。まず、ブルー スクリーン エラーが発生した場合は、再起動を試みることができます。

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

何?ズートピアは国産AIによって実現するのか?ビデオとともに公開されたのは、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルです。 Sora も同様の技術的ルートを使用し、自社開発の技術革新を多数組み合わせて、大きく合理的な動きをするだけでなく、物理世界の特性をシミュレートし、強力な概念的結合能力と想像力を備えたビデオを制作します。データによると、Keling は、最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。もう 1 つの重要な点は、Keling は研究所が公開したデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションであるということです。さらに、主な焦点は実用的であり、白紙小切手を書かず、リリースされたらすぐにオンラインに移行することです。Ke Ling の大型モデルは Kuaiying でリリースされました。

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

デバイスをリモートでプログラムする必要がある場合は、この記事が役に立ちます。あらゆるデバイスをプログラミングするためのトップ GE ユニバーサル リモート コードを共有します。 GE リモコンとは何ですか? GEUniversalRemote は、スマート TV、LG、Vizio、Sony、Blu-ray、DVD、DVR、Roku、AppleTV、ストリーミング メディア プレーヤーなどの複数のデバイスを制御するために使用できるリモコンです。 GEUniversal リモコンには、さまざまな機能を備えたさまざまなモデルがあります。 GEUniversalRemote は最大 4 台のデバイスを制御できます。あらゆるデバイスでプログラムできるトップのユニバーサル リモート コード GE リモコンには、さまざまなデバイスで動作できるようにするコードのセットが付属しています。してもいいです

Meta が立ち上げた Llama3、MistralAI が立ち上げた Mistral および Mixtral モデル、AI21 Lab が立ち上げた Jamba など、おなじみのオープンソースの大規模言語モデルは、OpenAI の競合相手となっています。ほとんどの場合、モデルの可能性を最大限に引き出すには、ユーザーが独自のデータに基づいてこれらのオープンソース モデルを微調整する必要があります。単一の GPU で Q-Learning を使用して、大規模な言語モデル (Mistral など) を小規模な言語モデルに比べて微調整することは難しくありませんが、Llama370b や Mixtral のような大規模なモデルを効率的に微調整することは、これまで課題として残されています。 。したがって、HuggingFace のテクニカル ディレクター、Philipp Sch 氏は次のように述べています。
