ホームページ > バックエンド開発 > Python チュートリアル > 私たちは、SWE ベンチの問題を解決する AI SWE を、% オープンソースで作成しました。

私たちは、SWE ベンチの問題を解決する AI SWE を、% オープンソースで作成しました。

Mary-Kate Olsen
リリース: 2024-12-23 11:26:11
オリジナル
853 人が閲覧しました

私たち Composio は、AI エージェント用のツール インフラストラクチャを構築しています。ユーザーの最大のリクエストの 1 つは、機能するカスタム コーディング エージェントを構築するためのツールキットでした。そこで、AI コーディング エージェントを構築するためのすべてのツールキットを備えたスターター テンプレートである SWE-Kit を作成しました。

これらのエージェントはローカルでエンドツーエンドで実行され、コーディング ワークフローを自動化できます。

ツールの効率をテストするために、LangGraph を使用して完全なオープンソースの包括的な AI エージェントを構築し、検証済みの SWE ベンチでテストしたところ、SWE ベンチ ライトでは 48.60%、41% の結果が得られました。

We made an AI SWE that solved  of issues on the SWE bench, % open-source.

SWE ベンチは、Django、Flask、Sklearn、SciPy などのリポジトリからの 2,200 を超える実際の Python の問題を含むベンチマークです。

We made an AI SWE that solved  of issues on the SWE bench, % open-source.

詳細については、技術レポートをご覧ください: SOTA AI エージェントに必要なのはツールの設計だけです
SWE エージェントの完全なコード: SWE-kit Agent


エージェントをローカルで実行するために必要なツール

  • コード分析ツール: リポジトリから関連するコード スニペットをインテリジェントに取得します。
  • ファイル ツール: ファイルのナビゲーションと更新を容易にします。
  • シェル ツール: シェル操作を実行します。
  • Git ツール: バージョン管理タスクを処理します。
  • 分離されたコード実行のための Composio Docker ワークスペース。

関数呼び出しの精度を向上させるためにツールを最適化しました。


SWE-kit と Composio を使用すると何を構築できますか?

コードはオープンソースであり、これを変更して GitHub、Jira、Linear、Slack などの外部統合を追加し、Composio を使用して本格的な AI ソフトウェア エンジニアを構築することもできます。

次のようなカスタム エージェントを使用して、ソフトウェア開発ワークフローの多くの側面を自動化できます。

  • コードの記述
  • コードベースのリファクタリング
  • テスト
  • ドキュメント
  • Linear や Jira などによるプロジェクト管理
  • Slack と Gmail を使用したコミュニケーション。

SWE-Kit エージェントのアーキテクチャの説明については、LangChains のブログで公開されている SWE-Kit エージェントのブログを参照してください。

冗談でもありません。多くの企業がこれだけで数百万ドルを調達しました。

今すぐ SWE-kit を使用してカスタム ローカル コーディング エージェントの構築を開始してください。

SWE-kit を使ってみる

以上が私たちは、SWE ベンチの問題を解決する AI SWE を、% オープンソースで作成しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート