ホームページ テクノロジー周辺機器 AI MetaGPT オープンソース フレームワークは GitHub で人気となり、スター数は 11,000 に達し、ソフトウェア開発プロセスをシミュレートしました

MetaGPT オープンソース フレームワークは GitHub で人気となり、スター数は 11,000 に達し、ソフトウェア開発プロセスをシミュレートしました

Aug 09, 2023 pm 10:53 PM
知的 オープンソース

大規模言語モデル (LLM) の継続的な開発により、それを使用した AI エージェントの構築が新しい研究分野になりました。過去の研究では、LLM を使用してマルチエージェント エージェントが自律的にいくつかのタスク

を実行できるようにすることに成功しましたが、現在の研究は主に単純なタスクに焦点を当てており、複雑なタスクの探索は不十分です。これは主に、大規模な言語モデルには「幻覚」の問題があり、特に複数のエージェントが対話する場合、幻覚の問題がより深刻になり、結果として複雑なタスクに適用できなくなるためです。 , この問題を解決しようとしているのが「MetaGPT」と呼ばれるオープンソースフレームワークです。 MetaGPT の目標は、メタプログラミング アプローチとして LLM 主導のマルチエージェント コラボレーションに効率的なヒューマン ワークフローを導入することです。 MetaGPT は、オンラインになってから数日後にすぐに 11.1,000 人以上のスターの注目を集めました

このプロジェクトの URL は次のとおりです: https:// github.com/geekan/MetaGPTMetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

要約すると、MetaGPT はソフトウェア開発会社のワークフローをシミュレートし、企業の担当者と同様に、各エージェントに役割を割り当て、コラボレーション プロセスを計画する必要があります。ソフトウェア開発会社 割り当て

MetaGPT は、まず標準化された操作手順 (SOP) をプロンプトに埋め込み、複数のエージェントのコラボレーション プロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、出力を検証して複合エラーを削減するために人間の作業者と同等の専門知識をエージェントに与えました。MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

MetaGPT は作業パイプラインをさまざまなエージェントに渡しました。役割が割り当てられているため、複雑なマルチエージェントのコラボレーション問題を効果的に解決し、連携を強化できるフレームワークを構築できます

## 推奨エンジンの開発をたとえば、研究チームは、MetaGPT の「アーキテクト エージェント」によって独自に生成されたシステム インターフェイス設計を実証しました。これはソフトウェア開発の重要なステップです。

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

MetaGPT は、単純なゲーム ソフトウェアの開発など、さまざまな複雑なタスクを実行でき、そのタスク実行プロセスは人間の開発者の標準操作手順 (SOP) と 1 対 1 で対応できます。

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程MetaGPT がユーザー入力要件を受け取った後、エージェントは製品マネージャーの役​​割を引き受け、要件と実現可能性を分析します。その後、エージェントはアーキテクト、プロジェクト マネージャー、エンジニアとして機能し、ソフトウェア開発を順番に完了します。最後に、別のエージェントがソフトウェアの包括的なテストを担当します。このプロセスは、実際の開発プロセスを非常によくシミュレートしています

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

#MetaGPT の完全な特定の開発タスクを見てみましょう場合。ユーザーは「ブラックジャック ゲームの作成」などの要件を指定するだけで、MetaGPT が要件分析とタスク計画を経て、ゲーム コード

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程## を正常に生成します。

#研究チームはプロジェクトのロードマップで次のように述べています: MetaGPT は短期的に中規模プロジェクト (約 2,000 行のコード) を独立して完了し、最終的には独立してトレーニング、微調整、最適化、適用できる機能を実現する予定です。


##MetaGPT が「METAGPT: META PROGRAMMING FOR MULTI-Agent COLLABORATIVE FRAMEWORK」というタイトルの研究論文を公開しました。 MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程

この論文は次のリンクからご覧いただけます: https://arxiv.org/pdf/2308.00352.pdf

興味のある読者は論文を参照して、研究トピックについて詳しく学ぶことができます

以上がMetaGPT オープンソース フレームワークは GitHub で人気となり、スター数は 11,000 に達し、ソフトウェア開発プロセスをシミュレートしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

オープンソースのフリーテキスト注釈ツールのおすすめ 10 選 オープンソースのフリーテキスト注釈ツールのおすすめ 10 選 Mar 26, 2024 pm 08:20 PM

テキスト注釈は、テキスト内の特定のコンテンツにラベルまたはタグを対応させる作業です。その主な目的は、特に人工知能の分野で、より深い分析と処理のためにテキストに追加情報を提供することです。テキスト注釈は、人工知能アプリケーションの教師あり機械学習タスクにとって非常に重要です。これは、自然言語テキスト情報をより正確に理解し、テキスト分類、感情分析、言語翻訳などのタスクのパフォーマンスを向上させるために AI モデルをトレーニングするために使用されます。テキスト アノテーションを通じて、AI モデルにテキスト内のエンティティを認識し、コンテキストを理解し、新しい同様のデータが出現したときに正確な予測を行うように教えることができます。この記事では主に、より優れたオープンソースのテキスト注釈ツールをいくつか推奨します。 1.LabelStudiohttps://github.com/Hu

オープンソースの無料画像注釈ツールおすすめ 15 選 オープンソースの無料画像注釈ツールおすすめ 15 選 Mar 28, 2024 pm 01:21 PM

画像の注釈は、ラベルまたは説明情報を画像に関連付けて、画像の内容に深い意味と説明を与えるプロセスです。このプロセスは機械学習にとって重要であり、画像内の個々の要素をより正確に識別するために視覚モデルをトレーニングするのに役立ちます。画像に注釈を追加することで、コンピュータは画像の背後にあるセマンティクスとコンテキストを理解できるため、画像の内容を理解して分析する能力が向上します。画像アノテーションは、コンピュータ ビジョン、自然言語処理、グラフ ビジョン モデルなどの多くの分野をカバーする幅広い用途があり、車両が道路上の障害物を識別するのを支援したり、障害物の検出を支援したりするなど、幅広い用途があります。医用画像認識による病気の診断。この記事では主に、より優れたオープンソースおよび無料の画像注釈ツールをいくつか推奨します。 1.マケセンス

飛び回ったり、口を開けたり、見つめたり、眉毛を上げたりする顔の特徴をAIが完璧に模倣し、ビデオ詐欺を防ぐことは不可能 飛び回ったり、口を開けたり、見つめたり、眉毛を上げたりする顔の特徴をAIが完璧に模倣し、ビデオ詐欺を防ぐことは不可能 Dec 14, 2023 pm 11:30 PM

これほど強力なAIの模倣能力では、それを防ぐことは本当に不可能です。 AIの発展は今ここまで進んでいるのか?前足で顔の特徴を浮き上がらせ、後ろ足で全く同じ表情を再現し、見つめたり、眉を上げたり、口をとがらせたり、どんなに大袈裟な表情でも完璧に真似しています。難易度を上げて、眉毛を高く上げ、目を大きく開き、口の形も歪んでいるなど、バーチャルキャラクターアバターで表情を完璧に再現できます。左側のパラメータを調整すると、右側の仮想アバターもそれに合わせて動きが変化し、口や目の部分がアップになります。同じです(右端)。この研究は、GaussianAvatars を提案するミュンヘン工科大学などの機関によるものです。

推奨: 優れた JS オープンソースの顔検出および認識プロジェクト 推奨: 優れた JS オープンソースの顔検出および認識プロジェクト Apr 03, 2024 am 11:55 AM

顔の検出および認識テクノロジーは、すでに比較的成熟しており、広く使用されているテクノロジーです。現在、最も広く使用されているインターネット アプリケーション言語は JS ですが、Web フロントエンドでの顔検出と認識の実装には、バックエンドの顔認識と比較して利点と欠点があります。利点としては、ネットワーク インタラクションの削減とリアルタイム認識により、ユーザーの待ち時間が大幅に短縮され、ユーザー エクスペリエンスが向上することが挙げられます。欠点としては、モデル サイズによって制限されるため、精度も制限されることが挙げられます。 js を使用して Web 上に顔検出を実装するにはどうすればよいですか? Web 上で顔認識を実装するには、JavaScript、HTML、CSS、WebRTC など、関連するプログラミング言語とテクノロジに精通している必要があります。同時に、関連するコンピューター ビジョンと人工知能テクノロジーを習得する必要もあります。 Web 側の設計により、次の点に注意してください。

Alibaba 7B マルチモーダル文書理解の大規模モデルが新しい SOTA を獲得 Alibaba 7B マルチモーダル文書理解の大規模モデルが新しい SOTA を獲得 Apr 02, 2024 am 11:31 AM

マルチモーダル文書理解機能のための新しい SOTA!アリババの mPLUG チームは、最新のオープンソース作品 mPLUG-DocOwl1.5 をリリースしました。これは、高解像度の画像テキスト認識、一般的な文書構造の理解、指示の遵守、外部知識の導入という 4 つの主要な課題に対処するための一連のソリューションを提案しています。さっそく、その効果を見てみましょう。複雑な構造のグラフをワンクリックで認識しMarkdown形式に変換:さまざまなスタイルのグラフが利用可能:より詳細な文字認識や位置決めも簡単に対応:文書理解の詳しい説明も可能:ご存知「文書理解」 「」は現在、大規模な言語モデルの実装にとって重要なシナリオです。市場には文書の読み取りを支援する多くの製品が存在します。その中には、主にテキスト認識に OCR システムを使用し、テキスト処理に LLM と連携する製品もあります。

リリースされたばかりの!ワンクリックでアニメ風の画像を生成するオープンソース モデル リリースされたばかりの!ワンクリックでアニメ風の画像を生成するオープンソース モデル Apr 08, 2024 pm 06:01 PM

最新の AIGC オープンソース プロジェクト、AnimagineXL3.1 をご紹介します。このプロジェクトは、アニメをテーマにしたテキストから画像へのモデルの最新版であり、より最適化された強力なアニメ画像生成エクスペリエンスをユーザーに提供することを目的としています。 AnimagineXL3.1 では、開発チームは、モデルのパフォーマンスと機能が新たな高みに達することを保証するために、いくつかの重要な側面の最適化に重点を置きました。まず、トレーニング データを拡張して、以前のバージョンのゲーム キャラクター データだけでなく、他の多くの有名なアニメ シリーズのデータ​​もトレーニング セットに含めました。この動きによりモデルの知識ベースが充実し、さまざまなアニメのスタイルやキャラクターをより完全に理解できるようになります。 AnimagineXL3.1 では、特別なタグと美学の新しいセットが導入されています

Llama 70B を実行するシングル カードはデュアル カードより高速、Microsoft は FP6 を A100 オープンソースに強制導入 Llama 70B を実行するシングル カードはデュアル カードより高速、Microsoft は FP6 を A100 オープンソースに強制導入 Apr 29, 2024 pm 04:55 PM

FP8 以下の浮動小数点数値化精度は、もはや H100 の「特許」ではありません。 Lao Huang は誰もが INT8/INT4 を使用できるようにしたいと考え、Microsoft DeepSpeed チームは NVIDIA からの公式サポートなしで A100 上で FP6 の実行を開始しました。テスト結果は、A100 での新しい方式 TC-FPx の FP6 量子化が INT4 に近いか、場合によってはそれよりも高速であり、後者よりも精度が高いことを示しています。これに加えて、エンドツーエンドの大規模モデルのサポートもあり、オープンソース化され、DeepSpeed などの深層学習推論フレームワークに統合されています。この結果は、大規模モデルの高速化にも即座に影響します。このフレームワークでは、シングル カードを使用して Llama を実行すると、スループットはデュアル カードのスループットの 2.65 倍になります。 1つ

1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT 1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT Mar 11, 2024 pm 12:07 PM

論文のアドレス: https://arxiv.org/abs/2307.09283 コードのアドレス: https://github.com/THU-MIG/RepViTRepViT は、モバイル ViT アーキテクチャで優れたパフォーマンスを発揮し、大きな利点を示します。次に、この研究の貢献を検討します。記事では、主にモデルがグローバル表現を学習できるようにするマルチヘッド セルフ アテンション モジュール (MSHA) のおかげで、軽量 ViT は一般的に視覚タスクにおいて軽量 CNN よりも優れたパフォーマンスを発揮すると述べられています。ただし、軽量 ViT と軽量 CNN のアーキテクチャの違いは十分に研究されていません。この研究では、著者らは軽量の ViT を効果的なシステムに統合しました。

See all articles