GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。
現在、AI モデルは非常に幅広い応用分野に関与していますが、ほとんどの AI モデルは特定のタスク向けに設計されており、正しいモデル アーキテクチャ、最適化アルゴリズム、およびハイパーパラメータ。 ChatGPT と GPT-4 が普及した後、人々はテキストの理解、生成、対話、推論などにおける大規模言語モデル (LLM) の大きな可能性を認識しました。研究者の中には、LLM を使用して汎用人工知能 (AGI) への新しい道を探ろうとする人もいます。
最近、テキサス大学オースティン校の研究者らは、タスク指向のプロンプトを開発し、LLM を使用してトレーニング パイプラインを自動化するという新しいアイデアを提案しました。このアイデアに基づいて、新しいアイデアを立ち上げました。システム AutoML-GPT。
紙のアドレス:
https: //www.php.cn/link/39d4b545fb02556829aab1db805021c3
AutoML-GPT は、GPT をさまざまな AI モデル間のブリッジとして使用し、最適化されたハイパーパラメーターを使用してモデルを動的にトレーニングします。 AutoML-GPT は、Model Card [Mitchell et al., 2019] および Data Card [Gebru et al., 2021] からユーザーリクエストを動的に受け取り、対応するプロンプト段落を構成します。最後に、AutoML-GPT はこのプロンプト段落を使用して、データの処理、モデル アーキテクチャの構築、ハイパーパラメーターの調整、トレーニング ログの予測などの複数の実験を自動的に実行します。
AutoML-GPT は、強力な NLP 機能と既存の AI モデルを最大限に活用することで、さまざまなテストやデータセットにわたる複雑な AI タスクを解決します。多数の実験とアブレーション研究により、AutoML-GPT が多くの人工知能タスク (CV タスクや NLP タスクを含む) に対して多用途で効果的であることが示されています。
AutoML-GPT の概要
AutoML-GPT は、データとモデル情報に依存してプロンプト入力段落をフォーマットする共同システムです。このうち、LLM がコントローラーとして機能し、複数のエキスパート モデルが協調的な実行者として機能します。 AutoML-GPT のワークフローには、データ処理、モデル アーキテクチャ設計、ハイパーパラメータ調整、トレーニング ログ生成の 4 つの段階が含まれます。
具体的には、AutoML-GPT の動作メカニズムは次のとおりです。モデル カードとデータ カードは、固定形式のプロンプト段落を生成します
#選択したデータ セットとモデル アーキテクチャに関するユーザーのニーズに対応するトレーニング パイプラインを構築します
- #パフォーマンス トレーニング ログを生成し、ハイパーパラメータを調整します
- #自動提案されたハイパーパラメータに基づいてモデルを調整します
- 入力分解
- AutoML-GPT の最初の段階は、LLM がユーザー入力を受け入れることです。 LLM のパフォーマンスを向上させ、効果的なプロンプトを生成するために、この研究では入力プロンプトに特定の命令を採用しました。これらの手順には、データ カード、モデル カード、評価メトリック、および追加要件の 3 つの部分が含まれています。
以下の図 3 に示すように、モデル カードは、モデル名、モデル構造、モデルの説明、およびアーキテクチャのハイパーパラメーターで構成されます。この情報を提供することにより、モデル カードは、機械学習システム全体でどのモデルが使用されているか、およびモデル アーキテクチャに対するユーザーの好みを LLM に伝えることができます。
データ カードとモデル カードに加えて、ユーザーは、より多くの評価ベンチマーク、評価指標、または制約をリクエストすることもできます。 AutoML-GPT は、これらのタスク仕様を高レベルの指示として LLM に提供し、それに応じてユーザー要件を分析します。 処理する必要のある一連のタスクがある場合、AutoML-GPT は各タスクに対応するモデルを照合する必要があります。この目標を達成するには、システムはまずモデル カードとユーザー入力からモデルの説明を取得する必要があります。 AutoML-GPT は、コンテキスト内のタスク モデル割り当てメカニズムを使用して、モデルをタスクに動的に割り当てます。このアプローチにより、増分モデルへのアクセスが可能になり、モデルの説明とユーザーのニーズのより深い理解とを組み合わせることで、より優れたオープン性と柔軟性が提供されます。 予測トレーニング ログを使用してハイパーパラメータを調整する AutoML-GPT は、データ カードとモデル カードに基づいてハイパーパラメータを設定します。ハイパーパラメータのトレーニング ログを生成することでパフォーマンスを予測します。システムは自動的にトレーニングを実行し、トレーニング ログを返します。データセット上のモデル パフォーマンス トレーニング ログには、トレーニング プロセス中に収集されたさまざまなメトリクスと情報が記録されます。これは、モデル トレーニングの進行状況を理解し、潜在的な問題を特定し、選択したアーキテクチャ、ハイパーパラメーター、最適化手法の有効性を評価するのに役立ちます。 AutoML-GPT のパフォーマンスを評価するために、この研究では ChatGPT (OpenAI の GPT-4 バージョン) を使用して実装し、複数の観点から複数の実験を実施します。 AutoML-GPT の効果を示します。 # 以下の図 4 は、AutoML-GPT を使用した未知のデータセットでのトレーニングの結果を示しています。 下の図 5 は、AutoML-GPT が COCO データ セットでターゲット検出タスクを完了するプロセスを示しています。 #下の図 6 は、AutoML-GPT を示しています。 NQ オープン データセット (Natural question Open データセット、[Kwiatkowski et al., 2019]) の実験結果: この研究では、評価された XGBoost も使用されました。 UCI Adult データセットに対する AutoML-GPT [Dua and Graff, 2017] を使用して、分類タスクでのパフォーマンスを調査しました。実験結果は、以下の図 7 に示されています。 ##興味のある読者は、論文の原文を読んで研究の詳細を学ぶことができます。 実験
以上がGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス

7月5日のこのウェブサイトのニュースによると、グローバルファウンドリーズは今年7月1日にプレスリリースを発行し、自動車とインターネットでの市場シェア拡大を目指してタゴール・テクノロジーのパワー窒化ガリウム(GaN)技術と知的財産ポートフォリオを買収したことを発表した。モノと人工知能データセンターのアプリケーション分野で、より高い効率とより優れたパフォーマンスを探求します。生成 AI などのテクノロジーがデジタル世界で発展を続ける中、窒化ガリウム (GaN) は、特にデータセンターにおいて、持続可能で効率的な電力管理のための重要なソリューションとなっています。このウェブサイトは、この買収中にタゴール・テクノロジーのエンジニアリングチームがGLOBALFOUNDRIESに加わり、窒化ガリウム技術をさらに開発するという公式発表を引用した。 G
