Rumah > Peranti teknologi > AI > teks badan

Pengaturcara AI sumber terbuka ada di sini: berkat GPT-4, keupayaan setanding dengan Devin, 1.4k Bintang sehari

WBOY
Lepaskan: 2024-04-03 15:01:20
ke hadapan
1096 orang telah melayarinya

Untuk mengetahui lebih lanjut tentang AIGC, sila layari:

51CTO AI.x Community

https://www.51cto.com/aigc/

Baru-baru ini, ramai orang menggantikan AI untuk Kerja mereka sendiri dan bimbang .

Devin, "pengaturcara AI pertama" yang menjadi popular dalam kalangan AI bulan lepas, telah menguasai kemahiran tindanan penuh dengan menggunakan keupayaan model yang besar Dia boleh menyelesaikan tugas kod kompleks secara automatik dengan hanya memerlukan bahasa semula jadi arahan daripada manusia.

Keupayaan alat yang ditunjukkan oleh Devin sangat menakjubkan, terutamanya untuk syarikat permulaan ini yang mengambil laluan sumber tertutup. Pada masa ini, hanya beberapa orang boleh menggunakan kuota beta tertutup ini.

Pada hari Selasa, penyelidik dari Princeton University NLP Group mengeluarkan SWE-agent, pengaturcara AI sumber terbuka, yang menerima beribu-ribu bintang GitHub dalam masa kurang dari sehari. Ejen SWE ini berdasarkan teknologi pembelajaran mendalam dan secara automatik boleh menulis kod yang cekap dan boleh dipercayai. Keluarannya menarik perhatian meluas, dan ramai pembangun menyatakan pengiktirafan tinggi terhadap teknologi dan prestasinya. Pencapaian ini juga membuktikan kemajuan penyelidikan AI dalam bidang NLP

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

Ejen SWE ialah sistem baharu untuk menyelesaikan masalah secara autonomi dalam repositori GitHub. Ia mencapai ketepatan yang sama dengan Devin di bangku simpanan SWE, mengambil purata 93 saat.

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

  • Tapak web projek: https://swe-agent.com/
  • GitHub: https://github.com/princeton-nlp/SWE-agent

John Yang, pengarang projek itu, berkata versi pracetak kertas berkaitan juga akan dimuat naik pada 10 April.

Pada dasarnya, ejen SWE boleh membetulkan pepijat dan isu dalam repositori GitHub sebenar dengan menukar model besar (seperti GPT-4) kepada ejen kejuruteraan perisian.

Pada set ujian bangku SWE yang lengkap, ejen SWE menyelesaikan 12.29% masalah, mencapai prestasi SOTA.

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

Untuk menyediakan automasi dalam proses pembangunan, ejen SWE berfungsi dengan berinteraksi dengan terminal khusus, yang boleh membuka, mencari kandungan fail, menggunakan semakan sintaks automatik, mengedit baris tertentu, dan juga boleh menulis dan melaksanakan ujian .

Pembangun projek ini mereka bentuk antara muka UI dengan teliti dan memperkenalkannya pada GitHub.

Agent-Computer Interface (ACI)

Pasukan penyelidik mereka bentuk arahan dan format maklum balas berpusatkan model besar (LM) yang mudah untuk membolehkan model besar menyemak imbas repositori, melihat dan mengedit serta melaksanakan fail kod, ini dipanggil Antara Muka Agen-Komputer (ACI). Pasukan penyelidik juga membina repositori ejen SWE untuk mengulang dengan mudah reka bentuk ACI bagi ejen berkod peringkat repositori.

Sama seperti model bahasa memerlukan kejuruteraan segera yang baik, reka bentuk ACI yang baik akan membawa kepada hasil yang lebih baik apabila menggunakan ejen. Ejen garis dasar tanpa ACI yang ditala dengan baik berprestasi lebih buruk daripada ejen SWE.

SWE-agent mengandungi ciri yang pasukan penyelidik mendapati sangat berguna semasa reka bentuk antara muka ejen-komputer, termasuk:

1. Tambahkan linter yang berjalan apabila arahan edit dikeluarkan, jika sintaks kod adalah tidak betul , arahan pengeditan tidak akan dibenarkan lulus.

2. Menyediakan pemapar fail yang dibina khas untuk ejen. Pasukan penyelidik mendapati bahawa pemapar fail ini berfungsi paling baik apabila ia memaparkan hanya 100 baris setiap pusingan, dan penyunting fail mempunyai arahan untuk menatal ke atas dan ke bawah serta melakukan carian dalam fail.

3. Menyediakan arahan carian rentetan seluruh direktori yang dibina khas untuk ejen. Pasukan penyelidik mendapati penting bahawa senarai alat sepadan dengan ringkas—hanya senaraikan setiap fail yang mempunyai sekurang-kurangnya satu padanan. Kajian menunjukkan bahawa menunjukkan model lebih konteks tentang setiap padanan akan menjadi terlalu mengelirukan untuk model.

4 Apabila output arahan kosong, kembalikan mesej: "Arahan anda berjaya dijalankan, tetapi tidak menghasilkan sebarang output."

Kertas terbitan masa hadapan akan memperincikan maklumat lanjut. 🎜🎜

Pemasangan dan penggunaan

Untuk menggunakan SWE-agent, anda mesti menetapkan syarat berikut:

1 Pasang Docker dan mulakan Docker secara tempatan

Pasang enco2. fenvironment.yml mencipta persekitaran swe-agent;

3 Gunakan conda activate swe-agent untuk mengaktifkan; 5. Cipta fail keys.cfg dalam direktori akar repositori ini dan isikan kandungan berikut:

OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'
Salin selepas log masuk
Saluran paip ejen SWE terdiri daripada dua langkah:

Langkah 1: SWE-agent menerima input isu GitHub dan kembalikan permintaan tarik untuk cuba membetulkannya;

Langkah 2: Nilaikan permintaan tarik untuk mengesahkan bahawa ia benar-benar membetulkan isu tersebut (pada masa ini hanya tersedia untuk isu dalam penanda aras SWE) .

  • Jika anda ingin berlari dan menilai di seluruh bangku SWE, cara paling mudah ialah menggunakan mesin x86. . . x komuniti
  • https://www.51cto.com/aigc/

Atas ialah kandungan terperinci Pengaturcara AI sumber terbuka ada di sini: berkat GPT-4, keupayaan setanding dengan Devin, 1.4k Bintang sehari. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan