スタンフォードの 70 億パラメータのオープンソース モデルは GPT-3.5 に匹敵し、100 ドルで再現可能
大規模な言語モデルがますます強力になるにつれて、人々は AI モデルに対してより高い倫理的要件を提案するようになりました。業界には、モデル規模の拡大という点でコンピューティング リソースの利点がありますが、モデルをより標準化して信頼性の高いものにするためには、学術コミュニティの努力が必要です。
最近、スタンフォード大学は、Meta の LLaMA 7B モデルに基づいて新しいモデル Alpaca を微調整しました。この研究では、OpenAI の text-davinci-003 モデルを使用して、Alpaca のトレーニング データとして自己指示方式で 52,000 個の指示に従うサンプルを生成しました。研究チームはトレーニングデータ、トレーニングデータを生成するコード、ハイパーパラメータをオープンソース化しており、今後モデルの重みやトレーニングコードも公開する予定だ。
- プロジェクトアドレス: https://github.com/tatsu-lab/stanford_alpaca
- トライアル用アドレス: https://alpaca-ai-custom6.ngrok.io/
実験結果は、アルパカの多くの行動が text-davinci-003 に似ていることを示しています。言い換えれば、パラメータが 7B しかない軽量モデルである Alpaca のパフォーマンスは、GPT-3.5 などの非常に大規模な言語モデルに匹敵します。
Alpaca モデルがどのように実行するかを見てみましょう。
トレーニング方法学術界の予算条件内でモデルに従った高品質の指導をトレーニングするには、2 つの重要な課題に直面します。それは、強力な事前トレーニング済み言語モデルと高品質な指導です。データに従ってください。
Meta が最近リリースした LLaMA モデル ファミリは、最初の課題に対処します。 2 番目の課題として、2022 年末の自己指導文書では、既存の強力な言語モデルを使用して指示データを自動的に生成することが提案されています。
紙のアドレス: https://arxiv.org/abs/2212.10560
この方法によれば、Alpaca は LLaMA 7B モデルの教師あり学習を使用して、自己命令の text-davinci-003 によって生成されたサンプルに従う 52K 命令を微調整します。やり方。
# 自己指導メソッドの概要。 Alpaca の研究チームは、まず自己指示シード セット内の 175 個の手動で記述された命令と出力のペアを使用し、次にこのシード セットをコンテキスト内のサンプル プロンプトとして使用しました。 text-davinci-003 を使用して、さらに指示を生成します。この研究では、ビルド パイプラインを簡素化し、コストを大幅に削減することで自己指示方式を改善しました。
この調査では、合計 52,000 の異なる命令とそれに対応する出力をトレーニング データとして生成しました。これらの出力には、 500ドル。研究チームはトレーニングデータをオープンソース化しているため、アルパカを再現したい開発者は500ドルを節約できる。
データセットに続くこの指示により、研究の次のステップは、Hugging Face のツールを使用して LLaMA モデルを微調整することでした。トレーニング フレームワークを利用し、FSDP (Fully Sharded Data Parallel) や混合精度トレーニングなどのテクノロジーを利用します。コストの面では、8 台の 80GB A100 で 7B LLaMA モデルを微調整するには 3 時間かかりますが、ほとんどのクラウド プロバイダーではコストは 100 ドル未満です。
モデル評価
研究は、自己指導型評価セットからの入力を使用して手動で評価され、研究チームの 5 人の学生によって完了されました。評価セットは自己啓発文書の著者によって収集され、電子メール、ソーシャル メディア、オフィス ツールを含むさまざまなユーザー指向の指示がカバーされています。text-davinci-003 と Alpaca 7B をペアでブラインド比較した結果、研究者らは 2 つのモデルのパフォーマンスが非常に似ており、Alpaca が text-davinci-003 よりわずかに優れていることを発見しました。
パラメータ スケールの観点から見ると、Alpaca は text-davinci-003 よりもはるかに小さく、モバイル端末は 7B の軽量言語モデルを実行することもできます。これにより、アルパカが重要になります。
この研究では、上記の静的自己命令評価セットの利用に加えて、Alpaca モデルで対話型テストも実施し、Alpaca が一般的に text-davinci-003 と同様のパフォーマンスを示すことがわかりました。
以下は、研究チームによってテストされた 2 つの例です。結果は、Alpaca の出力が良好であり、データセットに従う命令の一般的なスタイルを反映していることを示しています。たとえば、Alpaca は、text-davinci-003 と同様に、ChatGPT よりも簡潔な回答を出力することがよくあります。
モデルの欠陥
実験では、Alpaca は幻覚、毒性、固定観念など、言語モデルによくあるいくつかの欠陥も示しましたが、その中でも幻覚の問題は特に深刻です。
たとえば、下の写真では、アルパカはタンザニアの首都はダルエスサラームだと答えていますが、実際にはドドマであるはずです。
さらに、Alpaca は、一見良さそうに見えても、人々に誤解を与える可能性のあるエラーや虚偽の情報を含むテキストを生成することができます。 . .
Alpaca には、基礎となる言語モデルと命令チューニング データに関連するその他の欠陥が多数含まれている可能性があります。ただし、Alpaca は重要な欠陥を研究するための基礎として機能する比較的軽量なモデルを提供するため、機械学習コミュニティにとって依然として重要です。スタンフォード大学の研究チームはまた、アルパカは学術研究にのみ使用でき、商業利用は禁止されていると強調した。
次に、スタンフォード大学の研究チームは、Alpaca モデルの安全性、理解力、規模拡大などをさらに調査します。研究チームは、Alpaca によって指示に従うモデルの開発が促進されることを期待しています。
以上がスタンフォードの 70 億パラメータのオープンソース モデルは GPT-3.5 に匹敵し、100 ドルで再現可能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

AI は確かに数学を変えつつあります。最近、この問題に細心の注意を払っている陶哲軒氏が『米国数学協会会報』(米国数学協会会報)の最新号を送ってくれた。 「機械は数学を変えるのか?」というテーマを中心に、多くの数学者が意見を述べ、そのプロセス全体は火花に満ち、ハードコアで刺激的でした。著者には、フィールズ賞受賞者のアクシャイ・ベンカテシュ氏、中国の数学者鄭楽軍氏、ニューヨーク大学のコンピューター科学者アーネスト・デイビス氏、その他業界で著名な学者を含む強力な顔ぶれが揃っている。 AI の世界は劇的に変化しています。これらの記事の多くは 1 年前に投稿されたものです。

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

顔の検出および認識テクノロジーは、すでに比較的成熟しており、広く使用されているテクノロジーです。現在、最も広く使用されているインターネット アプリケーション言語は JS ですが、Web フロントエンドでの顔検出と認識の実装には、バックエンドの顔認識と比較して利点と欠点があります。利点としては、ネットワーク インタラクションの削減とリアルタイム認識により、ユーザーの待ち時間が大幅に短縮され、ユーザー エクスペリエンスが向上することが挙げられます。欠点としては、モデル サイズによって制限されるため、精度も制限されることが挙げられます。 js を使用して Web 上に顔検出を実装するにはどうすればよいですか? Web 上で顔認識を実装するには、JavaScript、HTML、CSS、WebRTC など、関連するプログラミング言語とテクノロジに精通している必要があります。同時に、関連するコンピューター ビジョンと人工知能テクノロジーを習得する必要もあります。 Web 側の設計により、次の点に注意してください。

マルチモーダル文書理解機能のための新しい SOTA!アリババの mPLUG チームは、最新のオープンソース作品 mPLUG-DocOwl1.5 をリリースしました。これは、高解像度の画像テキスト認識、一般的な文書構造の理解、指示の遵守、外部知識の導入という 4 つの主要な課題に対処するための一連のソリューションを提案しています。さっそく、その効果を見てみましょう。複雑な構造のグラフをワンクリックで認識しMarkdown形式に変換:さまざまなスタイルのグラフが利用可能:より詳細な文字認識や位置決めも簡単に対応:文書理解の詳しい説明も可能:ご存知「文書理解」 「」は現在、大規模な言語モデルの実装にとって重要なシナリオです。市場には文書の読み取りを支援する多くの製品が存在します。その中には、主にテキスト認識に OCR システムを使用し、テキスト処理に LLM と連携する製品もあります。

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません
