オープンソース AI プログラマーが登場: GPT-4 の祝福、デビンに匹敵する能力、1 日あたり 1.4,000 スター
AIGC の詳細については、次のサイトをご覧ください:
51CTO AI.x コミュニティ
https://www.51cto.com/ aigc/
最近、多くの人がAIに仕事を代替されるのではないかと懸念しています。
先月 AI 界で有名になった「最初の AI プログラマー」である Devin は、大規模なモデル機能を使用してフルスタックのスキルを習得しました。彼に必要なのは人間だけです。自然言語による指示を与え、複雑なコーディング タスクを自動化します。
Devin が実証したツールの機能は、特にクローズド ソース ルートをとるこの新興企業にとって、非常に驚くべきものです。現在、このクローズドベータ割り当てを利用できるのは少数の人だけです。
火曜日、プリンストン大学 NLP グループの研究者は、AI プログラマのオープンソース バージョンである SWE-agent をリリースしました。これは、1 日足らずで GitHub で数千のスターを獲得しました。 。この SWE エージェントは深層学習テクノロジーに基づいており、効率的で信頼性の高いコードを自動的に作成できます。彼のリリースは広く注目を集め、多くの開発者が彼の技術とパフォーマンスに高い評価を表明しました。これらの成果は、NLP 分野における AI 研究の進歩を証明するものでもあります。
SWE-agent は、GitHub リポジトリの問題を自律的に解決するための新しいシステムです。 SWE ベンチでの Devin と同様の精度を達成し、平均 93 秒かかりました。
- プロジェクト Web サイト: https://swe-agent.com/
- GitHub :https://github.com/princeton-nlp/SWE-agent
プロジェクトの作者である John Yang 氏は、関連論文 4月10日バージョンもアップ予定です。
原則として、SWE エージェントは、大規模なモデル (GPT-4 など) をソフトウェア エンジニアリング エージェントに変換することで、実際の GitHub リポジトリのバグや問題を修正できます。
完全な SWE ベンチ テスト セットにおいて、SWE エージェントは問題の 12.29% を解決し、SOTA パフォーマンスを達成しました。
開発中の自動化を実現するために、SWE エージェントは、ファイルを開いたり、ファイルの内容を検索したり、自動構文チェックを使用したりできる専用の端末と対話して動作します。 、特定の行を編集し、テストを作成して実行することもできます。
このプロジェクトの開発者は、慎重に UI インターフェイスを設計し、GitHub に導入しました。
エージェント コンピューター インターフェイス (ACI)
研究チームは、大規模モデル (LM) 中心のシンプルなコマンドとフィードバック形式を設計しました。モデルを使用すると、エージェント コンピューター インターフェイス (ACI) として知られる、リポジトリの参照、コード ファイルの表示、編集、実行がより簡単になります。研究チームは、リポジトリ レベルでコード化されたエージェントの ACI 設計を簡単に反復できるように、SWE エージェント リポジトリも構築しました。
言語モデルには優れたプロンプト エンジニアリングが必要であるのと同様に、優れた ACI 設計はエージェント使用時により良い結果につながります。 ACI が適切に調整されていないベースライン エージェントのパフォーマンスは、SWE エージェントよりもはるかに悪くなります。
SWE-agent には、研究チームがエージェントとコンピューターのインターフェイスの設計中に非常に役立つと判断した次のような機能が含まれています。 1. 編集コマンドの発行時に実行され、コード構文が間違っている場合は編集コマンドを実行させないリンターを追加します。
2. エージェントに専用のファイル ビューアを提供します。研究チームは、このファイル ビューアが 1 ラウンドあたり 100 行のみを表示する場合に最適に機能すること、およびファイル エディタには上下にスクロールしてファイル内で検索を実行するためのコマンドがあることを発見しました。
3. 特別に構築されたディレクトリ全体の文字列検索コマンドをエージェントに提供します。研究チームは、ツールが一致を簡潔にリストすることが重要であることを発見しました。少なくとも 1 つの一致があるすべてのファイルをリストするだけです。研究では、モデルに各一致に関するコンテキストをさらに示すと、モデルが混乱しすぎることがわかりました。
4. コマンドの出力が空の場合は、「コマンドは正常に実行されましたが、出力は生成されませんでした。」というメッセージが返されます。
今後出版される論文でさらに詳しい情報が記載されます。
安装与使用
要使用 SWE-agent,首先要设置好如下条件:
1. 安装 Docker,并在本地启动 Docker;
2. 安装 Miniconda,并使用 conda env create -fenvironment.yml 创建 swe-agent 环境;
3. 使用 conda activate swe-agent 激活;
4. 运行 ./setup.sh 创建 swe-agent docker 镜像;
5. 在此存储库的根目录下创建一个 keys.cfg 文件并填写以下内容:
OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'
SWE-agent pipeline 包含两个步骤:
- 第一步:SWE-agent 接收输入的 GitHub 问题,并返回尝试修复它的拉取请求(pull request);
- 第二步:评估拉取请求以验证它确实解决了问题(目前仅适用于 SWE-bench 基准测试中的问题)。
如果想在整个 SWE-bench 上运行和评估,最简单的方法是使用 x86 机器。
python run.py --model_name gpt4 \--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml
python run.py --model_name gpt4 \--per_instance_cost_limit 2.00 \--config_file ./config/default.yaml
如果想运行 SWE-bench 中的单个问题,可以使用 --instance_filter:
python run.py --model_name gpt4 \--instance_filter marshmallow-code__marshmallow-1359
想了解更多AIGC的内容,请访问:
51CTO AI.x社区
https://www.51cto.com/aigc/
以上がオープンソース AI プログラマーが登場: GPT-4 の祝福、デビンに匹敵する能力、1 日あたり 1.4,000 スターの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、Debianシステムの下でApacheログを分析することにより、Webサイトのパフォーマンスを改善する方法について説明します。 1.ログ分析の基本Apacheログは、IPアドレス、タイムスタンプ、リクエストURL、HTTPメソッド、応答コードなど、すべてのHTTP要求の詳細情報を記録します。 Debian Systemsでは、これらのログは通常、/var/log/apache2/access.logおよび/var/log/apache2/error.logディレクトリにあります。ログ構造を理解することは、効果的な分析の最初のステップです。 2。ログ分析ツールさまざまなツールを使用してApacheログを分析できます。コマンドラインツール:GREP、AWK、SED、およびその他のコマンドラインツール。

PythonはゲームとGUI開発に優れています。 1)ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2)GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

この記事では、Debian SystemsでApacheのログ形式をカスタマイズする方法について説明します。次の手順では、構成プロセスをガイドします。ステップ1:Apache構成ファイルにアクセスするDebianシステムのメインApache構成ファイルは、/etc/apache2/apache2.confまたは/etc/apache2/httpd.confにあります。次のコマンドを使用してルートアクセス許可を使用して構成ファイルを開きます。sudonano/etc/apache2/apache2.confまたはsudonano/etc/apache2/httpd.confステップ2:検索または検索または

Tomcatログは、メモリリークの問題を診断するための鍵です。 Tomcatログを分析することにより、メモリの使用状況とガベージコレクション(GC)の動作に関する洞察を得ることができ、メモリリークを効果的に見つけて解決できます。 Tomcatログを使用してメモリリークをトラブルシューティングする方法は次のとおりです。1。GCログ分析最初に、詳細なGCロギングを有効にします。 Tomcatの起動パラメーターに次のJVMオプションを追加します:-xx:printgcdetails-xx:printgcdateStamps-xloggc:gc.logこれらのパラメーターは、GCタイプ、リサイクルオブジェクトサイズ、時間などの情報を含む詳細なGCログ(GC.log)を生成します。分析GC.LOG

この記事では、DDOS攻撃検出方法について説明します。 「DebiansNiffer」の直接的なアプリケーションのケースは見つかりませんでしたが、次の方法はDDOS攻撃検出に使用できます:効果的なDDOS攻撃検出技術:トラフィック分析に基づく検出:突然のトラフィックの成長、特定のポートの接続の急増などのネットワークトラフィックの異常なパターンの識別。たとえば、PysharkライブラリとColoramaライブラリと組み合わせたPythonスクリプトは、ネットワークトラフィックをリアルタイムで監視し、アラートを発行できます。統計分析に基づく検出:データなどのネットワークトラフィックの統計的特性を分析することにより

この記事では、DebianシステムでNGINXSSL証明書を更新する方法について説明します。ステップ1:最初にCERTBOTをインストールして、システムがCERTBOTおよびPython3-Certbot-Nginxパッケージがインストールされていることを確認してください。インストールされていない場合は、次のコマンドを実行してください。sudoapt-getupdatesudoapt-getinstolcallcertbotthon3-certbot-nginxステップ2:certbotコマンドを取得して構成してlet'sencrypt証明書を取得し、let'sencryptコマンドを取得し、nginx:sudocertbot - nginxを構成します。

Debian Systemsでは、Readdir関数はディレクトリコンテンツを読み取るために使用されますが、それが戻る順序は事前に定義されていません。ディレクトリ内のファイルを並べ替えるには、最初にすべてのファイルを読み取り、QSORT関数を使用してソートする必要があります。次のコードは、debianシステムにreaddirとqsortを使用してディレクトリファイルを並べ替える方法を示しています。

Debian Systemsでは、Directoryコンテンツを読み取るためにReadDirシステム呼び出しが使用されます。パフォーマンスが良くない場合は、次の最適化戦略を試してください。ディレクトリファイルの数を簡素化します。大きなディレクトリをできる限り複数の小さなディレクトリに分割し、Readdirコールごとに処理されたアイテムの数を減らします。ディレクトリコンテンツのキャッシュを有効にする:キャッシュメカニズムを構築し、定期的にキャッシュを更新するか、ディレクトリコンテンツが変更されたときに、頻繁な呼び出しをreaddirに削減します。メモリキャッシュ(memcachedやredisなど)またはローカルキャッシュ(ファイルやデータベースなど)を考慮することができます。効率的なデータ構造を採用する:ディレクトリトラバーサルを自分で実装する場合、より効率的なデータ構造(線形検索の代わりにハッシュテーブルなど)を選択してディレクトリ情報を保存およびアクセスする
