GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

PHPz
リリース: 2023-05-26 13:22:34
転載
1328 人が閲覧しました

現在、AI モデルは非常に幅広い応用分野に関与していますが、ほとんどの AI モデルは特定のタスク向けに設計されており、正しいモデル アーキテクチャ、最適化アルゴリズム、およびハイパーパラメータ。 ChatGPT と GPT-4 が普及した後、人々はテキストの理解、生成、対話、推論などにおける大規模言語モデル (LLM) の大きな可能性を認識しました。研究者の中には、LLM を使用して汎用人工知能 (AGI) への新しい道を探ろうとする人もいます。

最近、テキサス大学オースティン校の研究者らは、タスク指向のプロンプトを開発し、LLM を使用してトレーニング パイプラインを自動化するという新しいアイデアを提案しました。このアイデアに基づいて、新しいアイデアを立ち上げました。システム AutoML-GPT。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

紙のアドレス:

https: //www.php.cn/link/39d4b545fb02556829aab1db805021c3

AutoML-GPT は、GPT をさまざまな AI モデル間のブリッジとして使用し、最適化されたハイパーパラメーターを使用してモデルを動的にトレーニングします。 AutoML-GPT は、Model Card [Mitchell et al., 2019] および Data Card [Gebru et al., 2021] からユーザーリクエストを動的に受け取り、対応するプロンプト段落を構成します。最後に、AutoML-GPT はこのプロンプト段落を使用して、データの処理、モデル アーキテクチャの構築、ハイパーパラメーターの調整、トレーニング ログの予測などの複数の実験を自動的に実行します。

AutoML-GPT は、強力な NLP 機能と既存の AI モデルを最大限に活用することで、さまざまなテストやデータセットにわたる複雑な AI タスクを解決します。多数の実験とアブレーション研究により、AutoML-GPT が多くの人工知能タスク (CV タスクや NLP タスクを含む) に対して多用途で効果的であることが示されています。

AutoML-GPT の概要

AutoML-GPT は、データとモデル情報に依存してプロンプト入力段落をフォーマットする共同システムです。このうち、LLM がコントローラーとして機能し、複数のエキスパート モデルが協調的な実行者として機能します。 AutoML-GPT のワークフローには、データ処理、モデル アーキテクチャ設計、ハイパーパラメータ調整、トレーニング ログ生成の 4 つの段階が含まれます。

具体的には、AutoML-GPT の動作メカニズムは次のとおりです。モデル カードとデータ カードは、固定形式のプロンプト段落を生成します

#選択したデータ セットとモデル アーキテクチャに関するユーザーのニーズに対応するトレーニング パイプラインを構築しますGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

    #パフォーマンス トレーニング ログを生成し、ハイパーパラメータを調整します
  • #自動提案されたハイパーパラメータに基づいてモデルを調整します
  • 入力分解
  • AutoML-GPT の最初の段階は、LLM がユーザー入力を受け入れることです。 LLM のパフォーマンスを向上させ、効果的なプロンプトを生成するために、この研究では入力プロンプトに特定の命令を採用しました。これらの手順には、データ カード、モデル カード、評価メトリック、および追加要件の 3 つの部分が含まれています。
以下の図 2 に示すように、データ カードの主要な部分は、データ セット名、入力データ セット タイプ (画像データやテキスト データなど)、ラベル スペース (カテゴリや解像度など)とデフォルトの評価指標。

以下の図 3 に示すように、モデル カードは、モデル名、モデル構造、モデルの説明、およびアーキテクチャのハイパーパラメーターで構成されます。この情報を提供することにより、モデル カードは、機械学習システム全体でどのモデルが使用されているか、およびモデル アーキテクチャに対するユーザーの好みを LLM に伝えることができます。

データ カードとモデル カードに加えて、ユーザーは、より多くの評価ベンチマーク、評価指標、または制約をリクエストすることもできます。 AutoML-GPT は、これらのタスク仕様を高レベルの指示として LLM に提供し、それに応じてユーザー要件を分析します。

処理する必要のある一連のタスクがある場合、AutoML-GPT は各タスクに対応するモデルを照合する必要があります。この目標を達成するには、システムはまずモデル カードとユーザー入力からモデルの説明を取得する必要があります。

AutoML-GPT は、コンテキスト内のタスク モデル割り当てメカニズムを使用して、モデルをタスクに動的に割り当てます。このアプローチにより、増分モデルへのアクセスが可能になり、モデルの説明とユーザーのニーズのより深い理解とを組み合わせることで、より優れたオープン性と柔軟性が提供されます。

予測トレーニング ログを使用してハイパーパラメータを調整する

AutoML-GPT は、データ カードとモデル カードに基づいてハイパーパラメータを設定します。ハイパーパラメータのトレーニング ログを生成することでパフォーマンスを予測します。システムは自動的にトレーニングを実行し、トレーニング ログを返します。データセット上のモデル パフォーマンス トレーニング ログには、トレーニング プロセス中に収集されたさまざまなメトリクスと情報が記録されます。これは、モデル トレーニングの進行状況を理解し、潜在的な問題を特定し、選択したアーキテクチャ、ハイパーパラメーター、最適化手法の有効性を評価するのに役立ちます。

実験

AutoML-GPT のパフォーマンスを評価するために、この研究では ChatGPT (OpenAI の GPT-4 バージョン) を使用して実装し、複数の観点から複数の実験を実施します。 AutoML-GPT の効果を示します。

# 以下の図 4 は、AutoML-GPT を使用した未知のデータセットでのトレーニングの結果を示しています。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

下の図 5 は、AutoML-GPT が COCO データ セットでターゲット検出タスクを完了するプロセスを示しています。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

#下の図 6 は、AutoML-GPT を示しています。 NQ オープン データセット (Natural question Open データセット、[Kwiatkowski et al., 2019]) の実験結果:

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

この研究では、評価された XGBoost も使用されました。 UCI Adult データセットに対する AutoML-GPT [Dua and Graff, 2017] を使用して、分類タスクでのパフォーマンスを調査しました。実験結果は、以下の図 7 に示されています。 ##興味のある読者は、論文の原文を読んで研究の詳細を学ぶことができます。

以上がGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!