世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

WBOY
リリース: 2024-08-14 13:38:32
オリジナル
416 人が閲覧しました
全員が順番待ちリストに載っています。

大型モデルは「人間のプログラマーの代替」の道を急速に進んでいます。

今年 3 月、人工知能ソフトウェア エンジニアの Devin は AI コミュニティを爆発させました。この製品は OpenAI の GPT-4 基本大規模言語モデル (LLM) を利用しており、自然言語テキストの命令を受け取った後、独立して記述および編集できます。 .コード。

しかし、生成AIの分野では急速な発展が主要なテーマであり、現在テクノロジーは再び反復されています。

今週、Y Combinator が支援する Cosine というスタートアップが、独自の新しい自律型 AI エンジニア Genie の立ち上げを発表しました。同社によると、GenieはサードパーティのベンチマークSWEベンチで30%のスコアを記録し、デビンを軽々と上回ったが、デビンのスコアはわずか13.8%だったという。

この新しいツールは、Amazon の Q および Factory の Code Droid を 19% も上回り、現在、世界で最もパフォーマンスの高い AI プログラマーとなっています。
世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

「このモデルは単なるベンチマークではありません。人間の SWE (ソフトウェア エンジニア) のように考えて行動することを目標に、ゼロからトレーニングされました」と Cosine の共同創設者兼 CEO、Alistair Pullen 氏は述べています。言った。
世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります
バグを修正してコードを書くことができるGenie

先進的なAIソフトウェアエンジニアリングモデルとして、Genieはバグ修正や機能ビルドを含む、人間のエンジニアの指示に従ってさまざまなコーディングタスクを自律的に処理できます。コードのリファクタリング、コードのテストなど。

Genie は完全に自律的に実行することも、ユーザーと協力してタスクを完了することもできます。

技術レポートに示されているように、JavaScript、Python、TypeScript、TSX、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP、Ruby などの複数のプログラミング言語をサポートしています。

Cosine は、Genie は人間のエンジニアの認知プロセスをシミュレートできると主張しています。 「人間のエンジニアがどのように働くかを観察し、そのプロセスを模倣させましょう。」とアリスター・プーレン氏は言いました。

セキュリティの問題は常に誰にとっても懸念事項です。Genie によって生成されたコードはユーザーの GitHub リポジトリに保存されるため、Cosine はコードのコピーを保持せず、それに伴うセキュリティ リスクを回避します。

さらに、Cosine のソフトウェア プラットフォームには、Slack とシステム通知が統合されており、AI の同僚のようなもので、ユーザーにステータスや問題の報告を思い出させます。

Alistair Pullen は、Genie を使用して現実世界の問題を解決する方法をデモンストレーションします。ターゲットは GitHub 上の課題で、リンクを直接ドロップするだけで、AI が自動的に問題を分析し、要件が満たされるまで問題を解決するために必要なファイルを検討し始めます。

世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

その後、Genie は問題を多くの解決ステップに分解してコードを生成しようとします。

世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

次のステップは、生成されたコードに問題がある場合、自動的に問題を検出し、分析し、変更して、再度実行を試みます。

世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

最終出力結果: 2 つのファイル、17 のテスト、わずか 84 秒。

世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります

人間のプログラマーより何倍速いかわかりません。

ロングコンテキストはOpenAIモデルによって強化されています

少数のツールによって補完されたベースモデルに依存する多くのAIモデルとは異なり、Genieは独自のプロセスを通じて開発されています。

モデルに関する限り、Genie は GPT-4o の (現時点では) 非ユニバーサルなバリアントに基づいて構築されており、OpenAI によって Cosine が実験的アクセス プログラムの一部としてトレーニングできるようになります。

研究者が Genie の構築を開始したとき、16 ~ 32k の範囲の比較的短いコンテキスト ウィンドウ モデルしか微調整できなかったことが技術レポートからわかりました。

この問題を解決するために、チームはこれらのモデルの初期段階で多くの調査を実施し、1億トークンを超える大規模なデータセットでトレーニングしましたが、このアーキテクチャには特定の利点があることが判明しました。モデルが一定時間内に処理できる情報量の制限。

さまざまな圧縮/チャンキング方法を試した後、当時は利用可能なモデルがなかったにもかかわらず、チームはより大きなコンテキスト モデルを使用することが唯一の解決策であると判断しました。

幸いなことに、その後すぐに、長いコンテキストのトレーニングを確実にする OpenAI モデルが登場しました。

Cosine は、データセットの整理に 1 年近くを費やしたと述べました。最新のトレーニング実行では、Genie は数十億のトークン データでトレーニングされ、選択されたデータにはユーザーが現在使用しているプログラミング言語が含まれていました。一番気になること。以下は、Genie のトレーニングプロセスにおけるさまざまなプログラミング言語のデータの割合です:
世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります
以下は、バグ修復や再構築などのさまざまな機能のデータの割合です:
世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります
Pullen 氏によると、Genie の価格設定は当初 2 段階に分けられます:

  • エントリーレベルのオプションの価格は約 20 ドルです。このレベルには、個人や小規模チームに適したいくつかの機能と使用制限があります。
  • エンタープライズ レベルのオプションでは、コーディングに熟練した AI 同僚がいるのと同じように、拡張機能とほぼ無制限の使用が提供されます。ただし、このレベルの価格は高くなります。

Genie の発売は、ソフトウェア開発チーム、特に生産性を向上させ、日常業務に費やす時間を削減したいと考えているチームに重大な影響を与えます。 Genie は複雑なプログラミングの課題を自律的に処理できるため、エンジニアリング リソースの割り当て方法を変更し、チームがより戦略的な取り組みに集中できるようにする可能性があります。

Pullen 氏は、エンジニアリング リソースがもはや制限ではなくなったことは、特に会社を立ち上げて以来、彼にとって大きなモチベーションになったと述べました。彼は、未知のコードベースに素早く入力し、目に見えない問題を解決できる AI 同僚の価値は明白であり、世界に大きな影響を与えると信じています。

将来的には、同社はモデルポートフォリオを拡張して、単純なタスク用の小型モデルと、より複雑な課題を処理できる大型モデルを含める予定です。さらに、Cosine はその取り組みをオープンソース コミュニティに拡大する予定です。

Genie は一部のユーザーが利用できるようになりましたが、より広範なアクセスはまだ完全には利用できません。

申請アドレス: https://cosine.sh/register

設立チーム: わずか5名

Pullen、Sam Stenner、Yang Liが提案したGenieスタートアップCosine 2022年設立、その使命は、人間の推論を適用して複雑な問題を解決することで、AI の限界を押し上げることです。明らかに、彼らの取り組みはソフトウェア エンジニアリングから始まります。
世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかります
その中で、ヤン・リーはオックスフォード大学で修士号を取得し卒業し、2021年にフォーブス誌のヨーロッパの30歳未満の30人リストに選ばれた中国人です。

Cosine は、Uphonest と SOMA Capital からシード資金で 250 万ドルを調達し、Lakestar、Focal なども参加しています。

チームは小規模かもしれませんが、Cosine は AI の分野ですでに大きな進歩を遂げており、Genie はほんの始まりにすぎません。

「私たちは、どんな仕事や業界でも人間レベルの推論能力を構築できると強く信じています」とプーレン氏は発表記事で述べた。"소프트웨어 엔지니어링은 가장 직관적인 출발점일 뿐이며, 우리가 작업 중인 다른 모든 작업도 곧 공개될 것입니다." -considerations-to-help-organizations-implement-an-ai-code-of-conducts/

https://cosine.sh/blog/genie-technical-report
https : //cosine.sh/blog/state-of-the-art

以上が世界で最も強力な AI プログラマー: GPT-4o の祝福により、リクエストを完了するのにわずか 84 秒かかりますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:jiqizhixin.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!