現在、AI モデルは非常に幅広い応用分野に関与していますが、ほとんどの AI モデルは特定のタスク向けに設計されており、正しいモデル アーキテクチャ、最適化アルゴリズム、およびハイパーパラメータ。 ChatGPT と GPT-4 が普及した後、人々はテキストの理解、生成、対話、推論などにおける大規模言語モデル (LLM) の大きな可能性を認識しました。研究者の中には、LLM を使用して汎用人工知能 (AGI) への新しい道を探ろうとする人もいます。
最近、テキサス大学オースティン校の研究者らは、タスク指向のプロンプトを開発し、LLM を使用してトレーニング パイプラインを自動化するという新しいアイデアを提案しました。このアイデアに基づいて、新しいアイデアを立ち上げました。システム AutoML-GPT。
紙のアドレス:
https: //www.php.cn/link/39d4b545fb02556829aab1db805021c3
AutoML-GPT は、GPT をさまざまな AI モデル間のブリッジとして使用し、最適化されたハイパーパラメーターを使用してモデルを動的にトレーニングします。 AutoML-GPT は、Model Card [Mitchell et al., 2019] および Data Card [Gebru et al., 2021] からユーザーリクエストを動的に受け取り、対応するプロンプト段落を構成します。最後に、AutoML-GPT はこのプロンプト段落を使用して、データの処理、モデル アーキテクチャの構築、ハイパーパラメーターの調整、トレーニング ログの予測などの複数の実験を自動的に実行します。
AutoML-GPT は、強力な NLP 機能と既存の AI モデルを最大限に活用することで、さまざまなテストやデータセットにわたる複雑な AI タスクを解決します。多数の実験とアブレーション研究により、AutoML-GPT が多くの人工知能タスク (CV タスクや NLP タスクを含む) に対して多用途で効果的であることが示されています。
AutoML-GPT は、データとモデル情報に依存してプロンプト入力段落をフォーマットする共同システムです。このうち、LLM がコントローラーとして機能し、複数のエキスパート モデルが協調的な実行者として機能します。 AutoML-GPT のワークフローには、データ処理、モデル アーキテクチャ設計、ハイパーパラメータ調整、トレーニング ログ生成の 4 つの段階が含まれます。
具体的には、AutoML-GPT の動作メカニズムは次のとおりです。モデル カードとデータ カードは、固定形式のプロンプト段落を生成します
#選択したデータ セットとモデル アーキテクチャに関するユーザーのニーズに対応するトレーニング パイプラインを構築します
以下の図 3 に示すように、モデル カードは、モデル名、モデル構造、モデルの説明、およびアーキテクチャのハイパーパラメーターで構成されます。この情報を提供することにより、モデル カードは、機械学習システム全体でどのモデルが使用されているか、およびモデル アーキテクチャに対するユーザーの好みを LLM に伝えることができます。
データ カードとモデル カードに加えて、ユーザーは、より多くの評価ベンチマーク、評価指標、または制約をリクエストすることもできます。 AutoML-GPT は、これらのタスク仕様を高レベルの指示として LLM に提供し、それに応じてユーザー要件を分析します。 処理する必要のある一連のタスクがある場合、AutoML-GPT は各タスクに対応するモデルを照合する必要があります。この目標を達成するには、システムはまずモデル カードとユーザー入力からモデルの説明を取得する必要があります。 AutoML-GPT は、コンテキスト内のタスク モデル割り当てメカニズムを使用して、モデルをタスクに動的に割り当てます。このアプローチにより、増分モデルへのアクセスが可能になり、モデルの説明とユーザーのニーズのより深い理解とを組み合わせることで、より優れたオープン性と柔軟性が提供されます。 予測トレーニング ログを使用してハイパーパラメータを調整する AutoML-GPT は、データ カードとモデル カードに基づいてハイパーパラメータを設定します。ハイパーパラメータのトレーニング ログを生成することでパフォーマンスを予測します。システムは自動的にトレーニングを実行し、トレーニング ログを返します。データセット上のモデル パフォーマンス トレーニング ログには、トレーニング プロセス中に収集されたさまざまなメトリクスと情報が記録されます。これは、モデル トレーニングの進行状況を理解し、潜在的な問題を特定し、選択したアーキテクチャ、ハイパーパラメーター、最適化手法の有効性を評価するのに役立ちます。 AutoML-GPT のパフォーマンスを評価するために、この研究では ChatGPT (OpenAI の GPT-4 バージョン) を使用して実装し、複数の観点から複数の実験を実施します。 AutoML-GPT の効果を示します。 # 以下の図 4 は、AutoML-GPT を使用した未知のデータセットでのトレーニングの結果を示しています。 下の図 5 は、AutoML-GPT が COCO データ セットでターゲット検出タスクを完了するプロセスを示しています。 #下の図 6 は、AutoML-GPT を示しています。 NQ オープン データセット (Natural question Open データセット、[Kwiatkowski et al., 2019]) の実験結果: この研究では、評価された XGBoost も使用されました。 UCI Adult データセットに対する AutoML-GPT [Dua and Graff, 2017] を使用して、分類タスクでのパフォーマンスを調査しました。実験結果は、以下の図 7 に示されています。 ##興味のある読者は、論文の原文を読んで研究の詳細を学ぶことができます。 実験
以上がGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。