目次
Getting Started Experience
JARVIS が現実に光を当てる
ホームページ テクノロジー周辺機器 AI かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

Apr 10, 2023 pm 02:39 PM
ai gpt

最強の組み合わせHuggingFace ChatGPT="Jarvis"のデモが公開中です。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

少し前に、浙江大学とマイクロソフトは、大規模モデル コラボレーション システムである HuggingGPT をリリースし、すぐにヒットしました。

研究者らは、ChatGPT をコントローラーとして使用して、HuggingFace コミュニティのさまざまな AI モデルを接続して、マルチモーダルな複雑なタスクを完了することを提案しました。

プロセス全体で行う必要があるのは、要件を自然言語で出力することだけです。

NVIDIA の科学者たちは、これが私が今週読んだ中で最も興味深い論文だと言いました。その考え方は、先ほど述べた「Everything App」に非常に近いもので、あらゆるものをアプリにして、その情報をAIが直接読み取るというものです。

Getting Started Experience

HuggingGPT に Gradio デモが追加されました。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

プロジェクト アドレス: https://github.com/microsoft/JARVIS

一部のネチズンがそれを体験し始めました。まず、「写真に何人写っているかを特定」しましょう。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

HuggingGPT は推論結果に基づいて、写真の中には 2 人が道を歩いていると結論付けました。

具体的なプロセスは次のとおりです。

まず、画像の説明に画像からテキストへのモデル nlpconnect/vit-gpt2-image-captioning を使用します。 、生成されたテキスト「電車のある通りを歩く二人の女性」。

次に、ターゲット検出モデル facebook/detrresnet 50 を使用して、写真内の人の数を検出します。モデルは 7 つの物体と 2 人の人物を検出しました。

次に、ビジュアル質問応答モデル dandelin/vilt-b32-finetuned-vqa を使用して結果を取得します。最後に、システムは、質問に答えるための詳細な応答とモデル情報を提供します。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

また、「愛しています」という文の感情を理解させ、それをタミル語 (Tamiḻ) に翻訳させます。

HuggingGPT は次のモデルを呼び出しました:

最初に、モデル「dslim/bert-base-NER」がテキスト「」と一致するために使用されました。 I love you 「感情の分類は「ロマンチック」です。

次に、「ChatGPT」を使用してテキストをタミル語に翻訳します。これは、「Nan unnai kadalikiren」です。

推論結果には、生成された画像、音声、またはビデオ ファイルはありません。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

#HuggingGPT が MP3 ファイルの転写時に失敗しました。あるネチズンは、「これが私の入力ファイルに問題があるかどうかはわかりません。」

画像生成機能を見てみましょう。

「A Dancing Cat」と入力し、「I LOVE YOU」というテキストをオーバーレイとして画像に追加します。

HuggingGPT は最初に「runwayml/stable-diffusion-1-5」モデルを使用して、指定されたテキストに基づいて「踊る猫」の画像を生成しました。

次に、同じモデルを使用して、指定されたテキストに基づいて「I LOVE YOU」の画像が生成されました。

最後に、2 つの写真を結合して、次の写真を出力します。

JARVIS が現実に光を当てる

プロジェクトがリリースされてから数日後、 Jarvis は GitHub で 12,500 個のスターを獲得し、811 個のフォークを獲得しました。

研究者らは、大規模言語モデル (LLM) の現在の問題を解決することが、AGI に向けた最初の重要なステップとなる可能性があると指摘しました。

大規模言語モデルの現在のテクノロジーにはまだいくつかの欠点があるため、AGI システムの構築には差し迫った課題がいくつかあります。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

複雑な AI タスクを処理するには、LLM が外部モデルと連携してその機能を活用できる必要があります。

したがって、重要なポイントは、LLM と AI モデルの橋渡しに適切なミドルウェアを選択する方法です。

この研究論文では、研究者は言語が HuggingGPT のユニバーサル インターフェイスであると提案しています。ワークフローは主に 4 つのステップに分かれています。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

#論文アドレス: https://arxiv.org/pdf/2303.17580.pdf

1 つ目はタスクの計画です。ChatGPT はユーザーのリクエストを解析し、それらを複数のタスクに分割し、その知識に基づいてタスクのシーケンスと依存関係を計画します。

#次にモデルの選択に進みます。 LLM は、HuggingFace のモデル記述に基づいて、解析されたタスクをエキスパート モデルに割り当てます。

次に、タスクを実行します。エキスパート モデルは、割り当てられたタスクを推論エンドポイントで実行し、実行情報と推論結果を LLM に記録します。

最後に、応答が生成されます。 LLM は実行プロセスのログと推論結果を要約し、ユーザーに要約を返します。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

このようなリクエストがあった場合:

本を読んでいる女の子の写真を生成してください, 彼女 ポーズはexample.jpgの男の子と同じです。次に、あなたの声を使って新しい画像を説明します。

HuggingGPT がそれを 6 つのサブタスクに分解し、それぞれ実行するモデルを選択して最終結果を取得する様子がわかります。

AI モデルの説明をプロンプトに組み込むことで、ChatGPT は AI モデルを管理する頭脳とみなすことができます。したがって、このメソッドを使用すると、ChatGPT が外部モデルを呼び出して実際のタスクを解決できるようになります。

簡単に言うと、HuggingGPT はコラボレーション システムであり、大規模なモデルではありません。

その機能は、ChatGPT と HuggingFace を接続して、さまざまなモダリティで入力を処理し、多くの複雑な人工知能タスクを解決することです。

つまり、HuggingFace コミュニティのすべての AI モデルには、HuggingGPT ライブラリに対応するモデルの説明があり、ChatGPT との接続を確立するためのプロンプトに統合されています。

HuggingGPT は、ChatGPT を頭脳として使用して、質問に対する答えを決定します。

これまで、HuggingGPT は ChatGPT を中心とした HuggingFace 上の数百のモデルを統合し、テキスト分類、ターゲット検出、セマンティック セグメンテーション、画像生成、質問と回答、テキスト読み上げ、などの 24 のタスクをカバーしました。ビデオへのテキストとして。

実験結果は、HuggingGPT がさまざまな形の複雑なタスクで優れたパフォーマンスを発揮できることを証明しています。

ネットユーザーからの熱いコメント

一部のネットユーザーは、HuggingGPT が以前 Microsoft によって提案された Visual ChatGPT に似ていると述べ、元のアイデアを巨大なセットに拡張したようです。事前トレーニングされたモデルの優れた。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

Visual ChatGPT は ChatGPT 上に直接構築されており、多くのビジュアル モデル (VFM) がそこに挿入されます。この記事ではプロンプト管理が提案されています。

PM の助けを借りて、ChatGPT はこれらの VFM を利用し、ユーザーの要件が満たされるか終了条件に達するまで、反復的にフィードバックを受け取ることができます。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

一部のネチズンは、このアイデアが実際に ChatGPT に非常によく似ていると信じています。 LLM を意味理解とタスク計画の中心として使用すると、LLM の機能を無限に向上させることができます。 LLM を他の機能またはドメインの専門家と組み合わせることで、さまざまなタスクやニーズにうまく適応できる、より強力で柔軟な AI システムを作成できます。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

#これは、私が AGI について常に考えてきたことです。人工知能モデルは、複雑なタスクを理解し、より小さなタスクを他のより特殊なタスクに割り当てることができます。AIモデル。

かっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしました

#脳と同じように、脳にも特定のタスクを実行するためのさまざまな部分がありますが、これは論理的に聞こえます。

以上がかっこよすぎて爆発する! HuggingGPT オンライン デモンストレーションは見事な外観を示し、ネチズンは画像生成を直接テストしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CentOS HDFS構成をチェックする方法 CentOS HDFS構成をチェックする方法 Apr 14, 2025 pm 07:21 PM

CENTOSシステムでHDFS構成をチェックするための完全なガイドこの記事では、CENTOSシステム上のHDFSの構成と実行ステータスを効果的に確認する方法をガイドします。次の手順は、HDFSのセットアップと操作を完全に理解するのに役立ちます。 Hadoop環境変数を確認します。最初に、Hadoop環境変数が正しく設定されていることを確認してください。端末では、次のコマンドを実行して、Hadoopが正しくインストールおよび構成されていることを確認します。HDFS構成をチェックするHDFSファイル:HDFSのコア構成ファイルは/etc/hadoop/conf/ディレクトリにあります。使用

Centosシャットダウンコマンドライン Centosシャットダウンコマンドライン Apr 14, 2025 pm 09:12 PM

Centos Shutdownコマンドはシャットダウンし、構文はシャットダウン[オプション]時間[情報]です。オプションは次のとおりです。-hシステムをすぐに停止します。 -pシャットダウン後に電源をオフにします。 -r再起動; -t待機時間。時間は、即時(現在)、数分(分)、または特定の時間(HH:mm)として指定できます。追加の情報をシステムメッセージに表示できます。

Centosのgitlabのバックアップ方法は何ですか Centosのgitlabのバックアップ方法は何ですか Apr 14, 2025 pm 05:33 PM

Centosシステムの下でのGitlabのバックアップと回復ポリシーデータセキュリティと回復可能性を確保するために、Gitlab on Centosはさまざまなバックアップ方法を提供します。この記事では、いくつかの一般的なバックアップ方法、構成パラメーター、リカバリプロセスを詳細に紹介し、完全なGitLabバックアップと回復戦略を確立するのに役立ちます。 1.手動バックアップGitlab-RakeGitlabを使用:バックアップ:コマンドを作成して、マニュアルバックアップを実行します。このコマンドは、gitlabリポジトリ、データベース、ユーザー、ユーザーグループ、キー、アクセスなどのキー情報をバックアップします。デフォルトのバックアップファイルは、/var/opt/gitlab/backupsディレクトリに保存されます。 /etc /gitlabを変更できます

Centosはmysqlをインストールします Centosはmysqlをインストールします Apr 14, 2025 pm 08:09 PM

CentOSにMySQLをインストールするには、次の手順が含まれます。適切なMySQL Yumソースの追加。 yumを実行して、mysql-serverコマンドをインストールして、mysqlサーバーをインストールします。ルートユーザーパスワードの設定など、MySQL_SECURE_INSTALLATIONコマンドを使用して、セキュリティ設定を作成します。必要に応じてMySQL構成ファイルをカスタマイズします。 MySQLパラメーターを調整し、パフォーマンスのためにデータベースを最適化します。

CentosでPytorchの分散トレーニングを操作する方法 CentosでPytorchの分散トレーニングを操作する方法 Apr 14, 2025 pm 06:36 PM

Pytorchの分散トレーニングでは、Centosシステムでトレーニングには次の手順が必要です。Pytorchのインストール:PythonとPipがCentosシステムにインストールされていることです。 CUDAバージョンに応じて、Pytorchの公式Webサイトから適切なインストールコマンドを入手してください。 CPUのみのトレーニングには、次のコマンドを使用できます。PipinstalltorchtorchtorchvisionTorchaudioGPUサポートが必要な場合は、CUDAとCUDNNの対応するバージョンがインストールされ、インストールに対応するPytorchバージョンを使用してください。分散環境構成:分散トレーニングには、通常、複数のマシンまたは単一マシンの複数GPUが必要です。場所

Dockerの原則の詳細な説明 Dockerの原則の詳細な説明 Apr 14, 2025 pm 11:57 PM

DockerはLinuxカーネル機能を使用して、効率的で孤立したアプリケーションランニング環境を提供します。その作業原則は次のとおりです。1。ミラーは、アプリケーションを実行するために必要なすべてを含む読み取り専用テンプレートとして使用されます。 2。ユニオンファイルシステム(UnionFS)は、違いを保存するだけで、スペースを節約し、高速化する複数のファイルシステムをスタックします。 3.デーモンはミラーとコンテナを管理し、クライアントはそれらをインタラクションに使用します。 4。名前空間とcgroupsは、コンテナの分離とリソースの制限を実装します。 5.複数のネットワークモードは、コンテナの相互接続をサポートします。これらのコア概念を理解することによってのみ、Dockerをよりよく利用できます。

Centosでgitlabログを表示する方法 Centosでgitlabログを表示する方法 Apr 14, 2025 pm 06:18 PM

CENTOSシステムでGitLabログを表示するための完全なガイドこの記事では、メインログ、例外ログ、その他の関連ログなど、CentosシステムでさまざまなGitLabログを表示する方法をガイドします。ログファイルパスは、gitlabバージョンとインストール方法によって異なる場合があることに注意してください。次のパスが存在しない場合は、gitlabインストールディレクトリと構成ファイルを確認してください。 1.メインGitLabログの表示

CentosのPytorchのGPUサポートはどのようにサポートされていますか CentosのPytorchのGPUサポートはどのようにサポートされていますか Apr 14, 2025 pm 06:48 PM

Pytorch GPUアクセラレーションを有効にすることで、CentOSシステムでは、PytorchのCUDA、CUDNN、およびGPUバージョンのインストールが必要です。次の手順では、プロセスをガイドします。CUDAおよびCUDNNのインストールでは、CUDAバージョンの互換性が決定されます。NVIDIA-SMIコマンドを使用して、NVIDIAグラフィックスカードでサポートされているCUDAバージョンを表示します。たとえば、MX450グラフィックカードはCUDA11.1以上をサポートする場合があります。 cudatoolkitのダウンロードとインストール:nvidiacudatoolkitの公式Webサイトにアクセスし、グラフィックカードでサポートされている最高のCUDAバージョンに従って、対応するバージョンをダウンロードしてインストールします。 cudnnライブラリをインストールする:

See all articles