ChatGPT は現在非常に人気があります。自然言語処理モデルのリーダーとしての ChatGPT の利点は、スムーズで一貫した会話を生成できると同時に、コンテキストを理解できることです。そしてコンテキストに従って行動します。さまざまなアプリケーション シナリオに合わせて迅速にカスタマイズでき、たとえば、顧客サービス、教育、エンターテイメントなどの分野で、ChatGPT をインテリジェント アシスタントとして使用して、ユーザーに便利なサービスとエンターテイメント体験を提供できます。
GPT-3 から GPT-4 まで、高度な推論、入力設定、動作の微調整、およびより長いコンテキスト情報の理解という点で、ChatGPT が継続的な最適化トレーニングにおいて大幅な進歩を遂げていることがわかります。
しかし、このインタラクティブな GPT モデルについては、むしろ、映画に登場する人工知能のような、自己認識と、自ら学習して進化する能力を備えたモデルであることを望んでいます。頻繁な指導や対話は必要なく、目標を提案するだけで、AIが実行計画や論理処理をすべて自律的に実行し、自己実証と最適化を継続して最終的に提案した目標を達成します。
そこで今日登場したのが、ChatGPT の進化版である AutoGPT です。
AutoGPT は、OpenAI の GPT-4 言語モデルを活用して、完全に自律的でカスタマイズ可能な AI エージェントを作成する実験的なオープン ソース アプリケーションです。トーラン・ブルース・リチャーズによって2023年3月30日にリリースされた。
ゲーム開発者のトランは、Significant Gravitas というゲーム会社を設立しました。
わずか 1 か月あまりで、AutoGPT の Git プロジェクトは 120 万以上のスターを獲得しました。完全に自律的に実行される GPT-4 の最初の例の 1 つとして、AutoGPT は AI の可能性の限界を突破しました。
AutoGPT は、他の AI ツールと比較して、独立して実行されるという点で独特です。つまり、ニーズに合わせてモデルを操作する必要がなくなりました。代わりに、目標を書き留めるだけで、残りは AI が代わりにやってくれます。その結果、AutoGPT は AI と人間の対話方法を根本的に変え、人間が積極的な役割を果たす必要がなくなり、同時に ChatGPT などの他の AI アプリケーションと同等以上の結果の品質を維持します。
AutoGPT は自律型 AI メカニズムに基づいて動作し、AI システムは次のような特定のタスクを満たすさまざまな AI エージェントを作成します。
ChatGPT で使用される最新の GPT-4 モデルは、GPT-3.5 と同じデータでトレーニングされており、GPT-3.5 は 2021 年 9 月までのみ利用可能です。ChatGPT を使用してリアルタイムの分析情報を取得することはできません。時間データ情報。情報を取得したり抽出したりするために Web サイトやオンライン プラットフォームにアクセスできないためです。
対照的に、AutoGPT はインターネットにアクセスできます。インターネットをサーフィンできるだけでなく、ソースが正当なものかどうかを確認することもできます。さらに、AutoGPT は任意のプラットフォームにアクセスしてタスクを実行できます。たとえば、AI に製品の販売見込みを調査してアウトリーチ メールを送信するよう依頼すると、AI は Gmail アカウントを使用してメールの下書きを直接送信します。
コンテキスト ウィンドウは、言語モデルが正確な答えを与えるために非常に重要です。ただし、GPT-4 のような LLM では、ウィンドウには 4000 ~ 8000 トークンの制限があります。したがって、要件が制限を超える場合、モデルはすべての指示に正しく従わない可能性があり、あるいは接線を逸脱して信頼性の低い出力を提供する可能性があります。
対照的に、AutoGPT は短期および長期のメモリ管理に優れています。メモリ管理にデータベース、ローカル キャッシュ、Redis を使用することで、大量のコンテキスト情報や以前の経験を保存でき、AI モデルがより適切な意思決定を行えるようになります。
AutoGPT は、デフォルトで DALL-E を使用するさまざまなイメージ生成エンジンを使用できるため、イメージを生成できます。 AI エージェントの画像生成を有効にしたい場合は、DALL-E の API にアクセスする必要があります。マルチモーダル入力方法であるにもかかわらず、この機能は現在 ChatGPT-4 では利用できません。
コマンド ラインで python -m autogpt --speak と入力すると、AutoGPT でテキスト読み上げを有効にできます。ただし、AutoGPT を操作するたびにコマンドを入力する必要があります。 AutoGPT を多用途 AI 音声ソフトウェア イレブン ラボに接続することで、音声にさまざまなサウンドを追加することもできます。
自律性が AI システムに新たな次元を追加することは疑いの余地がありません。同時に、AutoGPT の制限とリスクを無視することはできません。以下に、注意しなければならない重要な制限をいくつか示します。
AutoGPT の機能は素晴らしいですが、その実用性にはがっかりするかもしれません。 AutoGPT は高価な GPT-4 モデルを使用しているため、たとえ小さなタスクであっても、各タスクを完了するコストが高くなる可能性があります。これは主に、AutoGPT が特定のタスクのステップ中に GPT-4 を複数回使用することが原因です。
AutoGPT を使用するときにユーザーが直面する最も一般的な問題は、ループに陥ることです。これが数分以上続く場合は、プロセスを再起動する必要がある可能性があります。これは、AutoGPT がタスクを正しく定義および分解するために GPT-4 に依存しているために発生します。したがって、基盤となる LLM が AutoGPT がアクションを実行するには不十分な結果を返した場合、試行錯誤の問題が発生します。
AutoGPT は完全に承認されているため、twitter アカウントの使用、github へのログイン、検索エンジンの使用など、自律的に実行してシステムやインターネットにアクセスできます。 . なので、データが漏洩する可能性があります。 AutoGPT にはセキュリティ エージェントがないため、AutoGPT を使用する場合は注意が必要です。正しい指示とセキュリティ ガイドラインを提供せずにモデルの実行を継続させることはできません。
他の AI ツールとは異なり、AutoGPT にはプラットフォームや機能にアクセスするための単純な登録プロセスがありません。 AutoGPT の使用を開始する前に、要件を満たすさまざまなソフトウェアをダウンロードする必要があります。ステップの詳細な要件は次のとおりです:
まず、Git アカウントが必要で、Python3.1.0 以降をインストールする必要があります。また、一般的なシェル コマンドを巧みに使用できること、またはプロジェクトの起動と構成に Docker コンテナを使用できることも必要です。
まだ持っていない場合は、OpenAI アカウントを作成してください (もちろん、中国でアカウントを作成したい場合は、簡単なことではありません。インターネット上の他の記事を参照してアカウントを申請してください)。 OpenAI アカウントを開いたら、「USER - API キー」を開き、「API キー」タブに移動します。キーを作成するオプションが表示されます。それをクリックしてキーをコピーします。
コマンドを開きます行ツールは、コマンド git clone https://github.com/Torantulino/Auto-GPT.git を使用して、プロジェクトをローカルにクローンします。
コマンド cd Auto-GPT && ls -al を使用してディレクトリに入ると、多数のファイルがあることがわかります。そのうちの 1 つはrequirements.txtです。このファイルには、AutoGPT を実行するために必要なモジュールが含まれています。
これらのモジュールをインストールするには、コマンド pip install -rrequirements.txt を使用してダウンロードしてインストールします。
コマンド vim .env.template your-openai-api-key) を渡します。設定が完了したら、 mv .env.template .env を実行して設定を有効にします。
その他の関連設定は、必要に応じて参照して行うことができます。
OPENAI_API_KEY をテーブルに設定できます、AZURE を使用するかどうか |
|
過剰なトークンを避けるために、openAI によって提供されるトークン制限を構成できます。通話コストの無駄。デフォルトは 4000-8000 | |
LLM の基礎となる言語モデルを選択できます。デフォルトでは GPT-4 または gpt-3.5-turbo |
|
メモリ管理。ローカルで構成できます。 redis、PINECONE、MILVUS など。 | |
画像生成、画像サイズを構成できます画像生成エンジン: dalle、HUGGGINGFACE、安定した拡散 WEBUI | |
音声からテキストへ、 HUGGGINGFACE | を設定できます|
##リポジトリ アクション用の GIT プロバイダー | github 構成。github API キーを構成することで Github にアクセスして管理するために使用されます |
検索エンジン管理。Firefox、Chrome、Safari、検索エンジン: Google など、さまざまなブラウザを設定できます。認可されたオープン API は、インターネットにアクセスして情報を取得し、アクセスの深さを管理するために使用されます | |
音声合成設定には MAC OS、STREAMELEMENTS、ELEVENLABS を使用します | |
Twitter アカウント管理、 Twitter アカウントを管理および構成し、対応する API にアクセスするためのトークンを構成します | |
AutoGPT のデフォルト構成の一部 (ストレージ ディレクトリ、スイッチ、ユーザー エージェント、AI 設定など)。 |
以上が自己認識 AI: AutoGPTの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。