Jadual Kandungan
ChatGPT pandai membetulkan pepijat
Netizen mempunyai perasaan bercampur baur
Perekrutan global dan latihan penyumberan luar ChatGPT untuk menulis kod
Satu Perkara Lagi
Rumah Peranti teknologi AI Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Apr 15, 2023 am 09:16 AM
ai chatgpt Set data

Sejauh manakah ChatGPT membetulkan pepijat?

Akhirnya, seseorang sedang membuat penyelidikan serius mengenai perkara ini -

Penyelidik dari Jerman dan UK menyediakan "cabaran" khas untuk menguji keupayaan ChatGPT.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Selain ChatGPT, penyelidik juga menemui tiga lagi "wira AI" yang membetulkan pepijat dan meminta mereka membetulkan 40 kod ralat masing-masing.

Hasilnya benar-benar tidak diketahui, dan saya terkejut apabila membandingkannya.

ChatGPT membetulkan 31 pepijat dengan tepat, jauh di hadapan tempat kedua (21), secara langsung memenangi skor SOTA dalam "dunia pembetulan pepijat AI"!

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Sejak itu, kajian ini telah menarik ramai netizen untuk menonton dan membincangkan tajuk post ini di Reddit malah menggunakan perkataan "cermat" dan "perhatian" seperti ini :

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi sebenarnya, adakah ini benar-benar menjadikan pengaturcara "berbahaya"?

Mari kita lihat penyelidikan ini dahulu.

ChatGPT pandai membetulkan pepijat

Walaupun ChatGPT tidak direka khusus untuk membetulkan pepijat, sejak penubuhannya, ramai netizen telah mendapati bahawa ia mempunyai keupayaan ini.

Oleh itu, untuk mengetahui sejauh mana ChatGPT boleh mengubah suai pepijat, penyelidik memperkenalkan set penanda aras pembaikan ralat standard QuixBugs untuk penilaian.

Dan pemain AI yang bersaing dengannya ialah CodeX, CoCoNut dan Standard APR masing-masing.

Para penyelidik memilih 40 isu daripada QuixBugs dan meminta mereka membetulkan pepijat masing-masing.

Cara untuk membenarkan ChatGPT membetulkan pepijat adalah dengan bertanya dalam kotak dialog:

Adakah terdapat sebarang ralat dalam kod ini?

Selepas pusingan pertama pertempuran, keputusan adalah seperti berikut:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Berdasarkan keputusan pusingan pertama pertempuran, ChatGPT menetapkan 19, CodeX 21 telah ditetapkan, CoCoNut ditetapkan 19, dan APR Standard ialah 7.

Dan penyelidik juga mendapati bahawa jawapan ChatGPT adalah paling serupa dengan CodeX ini kerana ia adalah daripada keluarga model bahasa yang sama.

Pada masa ini, beberapa rakan akan bertanya, "Bukankah ChatGPT tidak sehebat CodeX?"

Jangan risau, jangan lupa, salah satu ciri ChatGPT ialah lebih banyak anda bertanya, lebih baik anda dapat.

Sebagai contoh, dalam set penanda aras ini, terdapat soalan yang dipanggil bitcount ChatGPT memberikan jawapan yang salah semasa pusingan pertama pembaikan:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Pada asalnya, ChatGPT harus menukar n ^ = n - 1 dalam baris 7 kepada n & = n - 1.

Tetapi pada pusingan pertama ia menjawab:

Saya tidak dapat mengetahui sama ada terdapat pepijat dalam program tanpa maklumat lanjut tentang tingkah laku yang dijangkakan dan input yang menyebabkan masalah .

Jadi selepas memberikan maklumat lanjut, ChatGPT menjawab soalan dengan betul.

Secara analogi, selepas memberikan lebih banyak maklumat gesaan untuk soalan yang tidak dijawab dengan betul pada pusingan pertama, keupayaan pembetulan pepijat ChatGPT telah dipertingkatkan dengan banyak:

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Akhirnya, ChatGPT menjawab 31 daripada 40 soalan pada QuixBugs dengan betul.

Netizen mempunyai perasaan bercampur baur

Berkenaan keputusan percubaan sebegitu, netizen mempunyai sikap berbeza terhadap ChatGPT membetulkan pepijat dan memenangi SOTA.

Sesetengah netizen percaya bahawa perkara ini tidak sepatutnya membuatkan pengaturcara berasa krisis, tetapi harus membuatkan mereka berasa gembira.

Implikasinya ialah dengan alatan berguna sedemikian, pengaturcara akan mendapat dua kali ganda hasil dengan separuh usaha.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Namun, sesetengah orang telah memberikan pandangan yang berbeza tentang perkara ini:

Kerja menjadi lebih mudah tidak bermakna lebih ramai tenaga kerja diperlukan Kurang?

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi sesetengah netizen merasakan kerja itu tidak berkesudahan:

Walaupun AI boleh memendekkan masa pembangunan dengan susunan magnitud, ia hanya bermakna pengaturcara The kerja seterusnya akan diproses dengan lebih cepat.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Secara keseluruhannya, ChatGPT pandai membetulkan pepijat dan tidak akan menyebabkan sebarang kemudaratan maut kepada pengaturcara.

Tetapi bagaimana jika kita memberi tumpuan kepada tindakan lain OpenAI?

Perekrutan global dan latihan penyumberan luar ChatGPT untuk menulis kod

Sebelum ini, OpenAI telah menyatakan bahawa salah satu kegunaan penting ChatGPT adalah untuk membantu pengaturcara menyemak kod.

Dalam erti kata lain, ia diletakkan sebagai alat bantu yang tersedia.

Berbanding dengan pandangan bahawa "ChatGPT menimbulkan ancaman", apabila keupayaan ChatGPT berkembang sepenuhnya, pengaturcara tidak perlu lagi takut menulis pepijat.

Pada papan catur yang dibentangkan oleh OpenAI, terdapat lebih daripada sekadar membetulkan pepijat dan mencuri kedudukan pengaturcara menara.

Untuk menjadikannya lebih besar dan kukuh, OpenAI telah didedahkan untuk menyediakan 1,000 jawatan penyumberan luar di Amerika Latin dan Eropah Timur.

Tugas utama pekerja penyumberan luar ialah melabel data dan melatih ChatGPT untuk menulis kod

Daripada 1,000 orang ini, 40% adalah pengaturcara mereka mencipta data untuk model OpenAI dan menggunakannya untuk mempelajari perisian Tugas kejuruteraan.

Sejak sekian lama, data latihan OpenAI telah diambil dari GitHub.

Set data yang dibuat oleh pengaturcara sumber luar pemula sekarang termasuk bukan sahaja baris kod, tetapi juga langkah logik pemikiran manusia di sebalik baris kod.

Seorang pembangun perisian Amerika Selatan mengumumkan bahawa dia telah menyelesaikan ujian pengekodan percuma selama lima jam untuk OpenAI.

Sepanjang proses itu, tugasnya dibahagikan kepada dua bahagian.

  • Terangkan dalam bahasa Inggeris bertulis cara menangani masalah pengekodan
  • Sediakan penyelesaian.

Jika pepijat ditemui, OpenAI akan bertanya kepadanya secara terperinci tentang situasi khusus pepijat dan cara membetulkannya.

Pengaturcara perlu menunjukkan setiap langkah berfikir tentang masalah itu, dan dia meneka bahawa OpenAI mungkin mahu menyediakan data latihan yang sangat khusus untuk ChatGPT.

Bekas pengarah AI Tesla Andrej Karpathy mengusik di Twitter:

Bahasa pengaturcaraan popular terkini ialah bahasa Inggeris.

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Tetapi setelah berkata demikian, adalah satu perkara yang baik bahawa ChatGPT mempunyai keupayaan membetulkan pepijat yang kuat, dan ia juga merupakan perkara yang baik jika ia benar-benar boleh berkembang kepada titik di mana ia boleh melengkapkan bahagian hafalan kod.

Lagipun, tujuan OpenAI yang dinyatakan semasa ia diasaskan adalah untuk "memastikan kecerdasan buatan am boleh memberi manfaat kepada semua manusia."

Walaupun pada pandangan pertama, apa yang telah dilakukan selama ini nampaknya agak komited untuk menggunakan usaha sesetengah orang untuk menjadikan lebih ramai orang menganggur.

Daripada menghancurkan manusia di arena Dota2 kepada prestasi cemerlang GPT-3, DALL-E2 dan ChatGPT, produk baharu yang dibawanya sentiasa disertai dengan perbincangan bahawa "xxx akan kehilangan pekerjaannya. "

Tetapi tidak kira apa pun, perniagaan sentiasa menggemarinya.

Buat masa ini, model perniagaan utama OpenAI ialah yuran API, yuran token dan pelesenan perisian.

OpenAI juga baru-baru ini mengeluarkan versi berbayar ChatGPT, ChatGPT Pro, yang berharga AS$42 sebulan (kira-kira RMB 285).

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Walaupun permulaan perbualan robot bermunculan seperti cendawan selepas hujan, terdapat banyak petanda bahawa pasaran terus optimis tentang OpenAI.

Microsoft baru sahaja mengumumkan bahawa ia akan melabur berbilion dolar dalam OpenAI dan menyepadukan model OpenAI ke dalam produk pengguna dan perusahaan seperti Microsoft Bing.

Menurut orang yang biasa dengan perkara itu, jumlah pelaburan tambahan adalah kira-kira AS$10 bilion.

Pada masa yang sama, berita yang didedahkan oleh WSJ menunjukkan bahawa pada awal Januari, Founders Fund, dana modal teroka yang diasaskan oleh bilionair Peter Thiel, sedang berunding untuk melabur dalam OpenAI.

Dilaporkan jumlah pembiayaan akan mencecah sekurang-kurangnya AS$300 juta.

Satu Perkara Lagi

Dalam pusingan pertama percubaan, ChatGPT tidak menyelesaikan masalah bitcount set data QuixBugs.

Tetapi jika anda bertanya soalan ini sekali lagi sekarang, anda akan mendapati bahawa ChatGPT boleh "dilalui semula":

Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira

Jadi adakah ini bermakna ChatGPT mempunyai berubah daripada Adakah anda belajar untuk menyelesaikan masalah semasa penyelidikan ini?

Pautan rujukan:

[1] ​​https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08​​​
[2] ​​​https://www.php. cn/link/8a47481ae534860850adf59f145e6b40​​​
[3] ​​​https://www.php.cn/link/7806689d934e610d6600🎜 ​3​ '
​https://www.php.cn/link/4271846620d203fd0511c422d483cdbd​

Atas ialah kandungan terperinci Pembetulan pepijat ChatGPT menyapu medan, dengan kadar ketepatan 78%! Netizen: Pengaturcara sepatutnya gembira. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah sebab mengapa PS terus menunjukkan pemuatan? Apakah sebab mengapa PS terus menunjukkan pemuatan? Apr 06, 2025 pm 06:39 PM

PS "Memuatkan" Masalah disebabkan oleh akses sumber atau masalah pemprosesan: Kelajuan bacaan cakera keras adalah perlahan atau buruk: Gunakan CrystaldiskInfo untuk memeriksa kesihatan cakera keras dan menggantikan cakera keras yang bermasalah. Memori yang tidak mencukupi: Meningkatkan memori untuk memenuhi keperluan PS untuk imej resolusi tinggi dan pemprosesan lapisan kompleks. Pemandu kad grafik sudah lapuk atau rosak: Kemas kini pemandu untuk mengoptimumkan komunikasi antara PS dan kad grafik. Laluan fail terlalu panjang atau nama fail mempunyai aksara khas: Gunakan laluan pendek dan elakkan aksara khas. Masalah PS sendiri: Pasang semula atau membaiki pemasang PS.

Bagaimana menyelesaikan masalah pemuatan apabila PS dimulakan? Bagaimana menyelesaikan masalah pemuatan apabila PS dimulakan? Apr 06, 2025 pm 06:36 PM

PS yang tersangkut pada "memuatkan" apabila boot boleh disebabkan oleh pelbagai sebab: Lumpuhkan plugin yang korup atau bercanggah. Padam atau namakan semula fail konfigurasi yang rosak. Tutup program yang tidak perlu atau menaik taraf memori untuk mengelakkan memori yang tidak mencukupi. Naik taraf ke pemacu keadaan pepejal untuk mempercepatkan bacaan cakera keras. Pasang semula PS untuk membaiki fail sistem rasuah atau isu pakej pemasangan. Lihat maklumat ralat semasa proses permulaan analisis log ralat.

Bagaimana untuk mengawal kelajuan main balik video di HTML5? Bagaimana untuk mencapai skrin penuh video di HTML5? Bagaimana untuk mengawal kelajuan main balik video di HTML5? Bagaimana untuk mencapai skrin penuh video di HTML5? Apr 06, 2025 am 10:24 AM

Dalam HTML5, kelajuan main balik video boleh dikawal melalui atribut mainbackrate, yang menerima nilai -nilai berikut: kurang daripada 1: main balik perlahan sama dengan 1: main balik kelajuan normal lebih besar daripada 1: main balik cepat sama dengan 0: jeda dalam html5, skrin penuh video dapat direalisasikan melalui permintaan yang diminta.

Proses pengeluaran halaman H5 Proses pengeluaran halaman H5 Apr 06, 2025 am 09:03 AM

H5 Page Proses Proses: Reka Bentuk: Rancangan Layout Halaman, Gaya dan Kandungan; Pembinaan Struktur HTML: Gunakan tag HTML untuk membina rangka kerja halaman; Penulisan Gaya CSS: Gunakan CSS untuk mengawal penampilan dan susun atur halaman; Pelaksanaan interaksi JavaScript: Tulis kod untuk mencapai animasi dan interaksi halaman; Pengoptimuman Prestasi: Memampatkan gambar, kod dan mengurangkan permintaan HTTP untuk meningkatkan kelajuan pemuatan halaman.

Bagaimana untuk menyelesaikan masalah pemuatan apabila PS membuka fail? Bagaimana untuk menyelesaikan masalah pemuatan apabila PS membuka fail? Apr 06, 2025 pm 06:33 PM

"Memuatkan" gagap berlaku apabila membuka fail pada PS. Sebab-sebabnya mungkin termasuk: fail yang terlalu besar atau rosak, memori yang tidak mencukupi, kelajuan cakera keras perlahan, masalah pemacu kad grafik, versi PS atau konflik plug-in. Penyelesaiannya ialah: Semak saiz fail dan integriti, tingkatkan memori, menaik taraf cakera keras, mengemas kini pemacu kad grafik, menyahpasang atau melumpuhkan pemalam yang mencurigakan, dan memasang semula PS. Masalah ini dapat diselesaikan dengan berkesan dengan memeriksa secara beransur -ansur dan memanfaatkan tetapan prestasi PS yang baik dan membangunkan tabiat pengurusan fail yang baik.

Bagaimana menggunakan bulu PS untuk menghasilkan kesan telus? Bagaimana menggunakan bulu PS untuk menghasilkan kesan telus? Apr 06, 2025 pm 07:03 PM

Kaedah Pengeluaran Kesan Telus: Gunakan alat pemilihan dan bulu untuk bekerjasama: Pilih kawasan telus dan bulu untuk melembutkan tepi; Tukar mod pengadunan lapisan dan kelegapan untuk mengawal ketelusan. Gunakan topeng dan bulu: Kawasan pilih dan bulu; Tambah topeng lapisan, dan ketelusan kawalan kecerunan skala kelabu.

Mana yang lebih mudah dipelajari, H5 atau JS? Mana yang lebih mudah dipelajari, H5 atau JS? Apr 06, 2025 am 09:18 AM

Kesukaran pembelajaran H5 (HTML5) dan JS (JavaScript) adalah berbeza, bergantung kepada keperluan. Laman web statik yang mudah hanya perlu belajar H5, sementara ia sangat interaktif dan memerlukan pembangunan front-end untuk menguasai JS. Adalah disyorkan untuk belajar H5 terlebih dahulu dan kemudian secara beransur -ansur belajar JS. H5 terutamanya belajar tag dan mudah dimulakan; JS adalah bahasa pengaturcaraan dengan lengkung pembelajaran yang curam dan memerlukan pemahaman sintaks dan konsep, seperti penutupan dan rantaian prototaip. Dari segi perangkap, H5 terutamanya melibatkan keserasian dan pemahaman semantik, sementara JS melibatkan sintaks, pengaturcaraan asynchronous dan pengoptimuman prestasi.

Apa yang perlu saya lakukan jika kad PS berada di antara muka pemuatan? Apa yang perlu saya lakukan jika kad PS berada di antara muka pemuatan? Apr 06, 2025 pm 06:54 PM

Antara muka pemuatan kad PS mungkin disebabkan oleh perisian itu sendiri (fail rasuah atau konflik plug-in), persekitaran sistem (pemacu yang wajar atau fail sistem rasuah), atau perkakasan (rasuah cakera keras atau kegagalan tongkat memori). Pertama semak sama ada sumber komputer mencukupi, tutup program latar belakang dan lepaskan memori dan sumber CPU. Betulkan pemasangan PS atau periksa isu keserasian untuk pemalam. Mengemas kini atau menewaskan versi PS. Semak pemacu kad grafik dan kemas kini, dan jalankan semak fail sistem. Jika anda menyelesaikan masalah di atas, anda boleh mencuba pengesanan cakera keras dan ujian memori.

See all articles