Rumah Peranti teknologi AI Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Jan 16, 2024 pm 01:12 PM
projek uiuc

Sama seperti tongkat Rhysford mencipta legenda ahli silap mata yang luar biasa dari semua peringkat umur, seperti Dumbledore, model bahasa berskala besar tradisional dengan potensi besar, selepas pra-latihan/penalaan kod korpus, telah menguasai pengetahuan di luar Perlaksanaan asal .

Secara khusus, versi lanjutan model besar telah dipertingkatkan dari segi penulisan kod, penaakulan yang lebih kukuh, rujukan bebas kepada antara muka pelaksanaan, penambahbaikan bebas, dsb., yang akan memudahkannya untuk berfungsi sebagai AI ejen dan melaksanakan tugas hiliran Faedah dalam semua aspek.

Baru-baru ini, pasukan penyelidik dari Universiti Illinois di Urbana-Champaign (UIUC) menerbitkan ulasan penting.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Pautan kertas: https://arxiv.org/abs/2401.00812

Semakan ini meneroka cara kod memperkasakan model bahasa besar (LLM) dan ejen pintar mereka yang berkuasa (Agen pintar) berdasarkannya . Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa
Antaranya, kod secara khusus merujuk kepada bahasa formal yang boleh dilaksanakan oleh mesin dan boleh dibaca oleh manusia, seperti bahasa pengaturcaraan, satu set fungsi yang telah ditetapkan, dsb. Sama seperti cara kami membimbing LLM untuk memahami/menjana bahasa semula jadi tradisional, menjadikan LLM mahir dalam kod hanya memerlukan penggunaan objektif latihan pemodelan bahasa yang sama pada data kod.

Berbeza daripada model bahasa tradisional, LLM biasa hari ini, seperti Llama2 dan GPT4, bukan sahaja meningkat dengan ketara dalam saiz, tetapi mereka juga telah menjalani latihan korpus kod yang bebas daripada korpus bahasa semula jadi yang biasa. Kod mempunyai sintaks piawai, ketekalan logik, abstraksi dan modulariti, dan boleh mengubah matlamat peringkat tinggi kepada langkah boleh laku, menjadikannya medium yang ideal untuk menghubungkan manusia dan komputer.

Seperti yang ditunjukkan dalam Rajah 2, dalam ulasan ini, penyelidik menyusun kerja yang berkaitan dan menganalisis secara terperinci pelbagai kelebihan memasukkan kod ke dalam data latihan LLM.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Secara khusus, penyelidik memerhatikan bahawa sifat unik kod membantu:

1 Meningkatkan keupayaan menulis kod LLM, keupayaan penaakulan dan keupayaan untuk memproses maklumat semula jadi yang lebih kompleks. tugas bahasa;
2. Membimbing LLM untuk menjana langkah perantaraan yang berstruktur dan tepat, yang boleh disambungkan ke pengakhiran pelaksanaan luaran melalui panggilan fungsi
3.

Selain itu, para penyelidik juga memerhati dengan mendalam bagaimana item pengoptimuman LLM yang diberikan oleh kod ini boleh mengukuhkan mereka sebagai pusat pembuat keputusan Ejen Pintar, memahami arahan, menguraikan matlamat, merancang dan melaksanakan tindakan, dan bertambah baik daripada keupayaan siri maklum balas.

Seperti yang ditunjukkan dalam Rajah 3, pada bahagian pertama, penyelidik mendapati bahawa pra-latihan LLM mengenai kod telah meluaskan skop tugas LLM melebihi bahasa semula jadi. Model ini boleh menyokong pelbagai aplikasi, termasuk penjanaan kod untuk teori matematik, tugas pengaturcaraan am dan pengambilan data. Kod perlu menghasilkan urutan langkah yang teratur dan koheren secara logik, yang penting untuk pelaksanaan yang berkesan. Selain itu, kebolehlaksanaan setiap langkah dalam kod membenarkan pengesahan langkah demi langkah bagi logik. Mengeksploitasi dan membenamkan atribut kod ini dalam pra-latihan meningkatkan prestasi Rantaian Pemikiran (CoT) LLM dalam banyak tugas hiliran bahasa semula jadi tradisional, mengesahkan peningkatan mereka dalam kemahiran penaakulan yang kompleks. Pada masa yang sama, dengan mempelajari format kod berstruktur secara tersirat, codeLLM berfungsi dengan lebih baik pada tugasan penaakulan berstruktur akal, seperti yang berkaitan dengan bahasa penanda, HTML dan pemahaman rajah.
Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa
Seperti yang ditunjukkan dalam Rajah 4, menyambungkan LLM dengan hujung berfungsi lain (iaitu melanjutkan keupayaan LLM melalui alatan luaran dan modul pelaksanaan) membantu LLM melaksanakan tugas dengan lebih tepat dan boleh dipercayai.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Dalam bahagian kedua, seperti yang ditunjukkan dalam Jadual 1, penyelidik memerhatikan trend umum: LLM mewujudkan sambungan dengan titik akhir berfungsi lain dengan menjana bahasa pengaturcaraan atau memanfaatkan fungsi yang telah ditetapkan. "Paradigma berpusatkan kod" ini berbeza daripada pendekatan tegar bagi panggilan alat pengekodan keras dalam mekanisme inferens LLM, yang membolehkan LLM menjana token secara dinamik yang memanggil modul pelaksanaan, dengan parameter boleh laras.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Paradigma ini menyediakan cara yang mudah dan jelas untuk LLM berinteraksi dengan tujuan fungsian yang lain, meningkatkan fleksibiliti dan kebolehskalaan aplikasinya. Lebih penting lagi, ia juga membolehkan LLM berinteraksi dengan banyak titik akhir berfungsi yang meliputi pelbagai modaliti dan domain. LLM mampu mengendalikan tugas yang lebih kompleks dengan mengembangkan bilangan dan pelbagai hujung fungsi yang boleh diakses oleh LLM.

Seperti yang ditunjukkan dalam Rajah 5, membenamkan LLM ke dalam persekitaran pelaksanaan kod boleh mencapai maklum balas automatik dan penambahbaikan model bebas. LLM berprestasi melebihi julat parameter latihan mereka, sebahagiannya kerana mereka dapat menampung maklum balas. Walau bagaimanapun, maklum balas mesti dipilih dengan teliti kerana input isyarat yang bising boleh menghalang prestasi LLM pada tugas hiliran. Selain itu, memandangkan sumber manusia mahal, maklum balas perlu dikumpul secara automatik sambil mengekalkan keasliannya. Dalam bahagian ketiga, penyelidik mendapati bahawa membenamkan LLM ke dalam persekitaran pelaksanaan kod boleh menghasilkan maklum balas yang memenuhi semua kriteria ini.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Pertama sekali, memandangkan pelaksanaan kod adalah deterministik, mendapatkan maklum balas daripada hasil pelaksanaan kod boleh secara langsung dan jujur ​​​​mencerminkan tugas yang dilakukan oleh LLM. Selain itu, jurubahasa kod menyediakan LLM cara untuk bertanya maklum balas dalaman secara automatik, menghapuskan keperluan untuk anotasi manusia yang mahal apabila memanfaatkan LLM untuk nyahpepijat atau mengoptimumkan kod yang salah. Persekitaran penyusunan dan pelaksanaan Kod juga membolehkan LLM menggabungkan borang maklum balas luaran yang pelbagai dan komprehensif, seperti penjanaan ringkas penilaian betul dan ralat binari, penjelasan bahasa semula jadi yang lebih kompleks tentang hasil pelaksanaan, dan pelbagai peringkat dengan kaedah maklum balas, semuanya jadikan kaedah meningkatkan prestasi sangat disesuaikan.

Dengan menganalisis pelbagai cara penyepaduan data latihan kod meningkatkan keupayaan LLM, penyelidik seterusnya mendapati bahawa kelebihan kod memperkasakan LLM amat jelas dalam bidang aplikasi LLM utama pembangunan Agen Pintar.

Rajah 6 menunjukkan aliran kerja standard pembantu pintar. Para penyelidik mendapati bahawa penambahbaikan yang dibawa oleh latihan kod dalam LLM juga mempengaruhi langkah sebenar yang mereka lakukan sebagai pembantu pintar.

Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa

Langkah-langkah ini termasuk: (1) meningkatkan keupayaan membuat keputusan IA dalam kesedaran dan perancangan konteks, (2) mengoptimumkan pelaksanaan strategi dengan melaksanakan tindakan ke dalam primitif tindakan modular dan ingatan organisasi yang cekap, dan (3) Mengoptimumkan prestasi melalui maklum balas yang diperoleh secara automatik daripada persekitaran pelaksanaan kod.

Ringkasnya, dalam semakan ini, penyelidik menganalisis dan menjelaskan cara kod memberikan keupayaan hebat kepada LLM dan cara kod membantu LLM bekerja sebagai pusat membuat keputusan Ejen Pintar.

Melalui tinjauan literatur yang komprehensif, penyelidik mendapati bahawa selepas latihan kod, LLM meningkatkan kemahiran pengaturcaraan dan keupayaan penaakulan mereka, memperoleh keupayaan untuk melaksanakan sambungan fleksibel dengan pelbagai hujung fungsi merentas mod dan domain, dan mengukuhkan keupayaan untuk berinteraksi dengan modul penilaian disepadukan dalam persekitaran pelaksanaan kod dan mencapai peningkatan diri automatik.

Selain itu, keupayaan LLM yang dipertingkat yang dibawa oleh latihan kod membantu prestasi mereka sebagai Ejen Pintar dalam aplikasi hiliran, dicerminkan dalam langkah operasi khusus seperti membuat keputusan, pelaksanaan dan peningkatan diri. Di samping mengkaji penyelidikan terdahulu, penyelidik juga mencadangkan beberapa cabaran dalam bidang sebagai elemen panduan untuk hala tuju masa depan yang berpotensi.

Sila rujuk artikel asal untuk butiran lanjut!

Atas ialah kandungan terperinci Keluarkan sumber pengaturcaraan yang sangat baik, model dan ejen gergasi akan mencetuskan kuasa yang lebih berkuasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Jun 24, 2024 pm 03:04 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Jul 19, 2024 am 01:29 AM

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Jul 17, 2024 am 01:56 AM

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Jul 17, 2024 pm 10:02 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Aug 01, 2024 pm 05:18 PM

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Penjanaan video tanpa had, perancangan dan membuat keputusan, penyebaran paksa penyepaduan ramalan token seterusnya dan penyebaran jujukan penuh Penjanaan video tanpa had, perancangan dan membuat keputusan, penyebaran paksa penyepaduan ramalan token seterusnya dan penyebaran jujukan penuh Jul 23, 2024 pm 02:05 PM

Pada masa ini, model bahasa berskala besar autoregresif menggunakan paradigma ramalan token seterusnya telah menjadi popular di seluruh dunia Pada masa yang sama, sejumlah besar imej dan video sintetik di Internet telah menunjukkan kepada kami kuasa model penyebaran. Baru-baru ini, pasukan penyelidik di MITCSAIL (salah seorang daripadanya ialah Chen Boyuan, pelajar PhD di MIT) berjaya menyepadukan keupayaan berkuasa model resapan jujukan penuh dan model token seterusnya, dan mencadangkan paradigma latihan dan pensampelan: Diffusion Forcing (DF). ). Tajuk kertas: DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion Alamat kertas: https:/

Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Aug 05, 2024 pm 03:32 PM

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Jul 17, 2024 am 10:14 AM

Tunjukkan rantai sebab kepada LLM dan ia mempelajari aksiom. AI sudah pun membantu ahli matematik dan saintis menjalankan penyelidikan Contohnya, ahli matematik terkenal Terence Tao telah berulang kali berkongsi pengalaman penyelidikan dan penerokaannya dengan bantuan alatan AI seperti GPT. Untuk AI bersaing dalam bidang ini, keupayaan penaakulan sebab yang kukuh dan boleh dipercayai adalah penting. Penyelidikan yang akan diperkenalkan dalam artikel ini mendapati bahawa model Transformer yang dilatih mengenai demonstrasi aksiom transitiviti sebab pada graf kecil boleh digeneralisasikan kepada aksiom transitiviti pada graf besar. Dalam erti kata lain, jika Transformer belajar untuk melakukan penaakulan sebab yang mudah, ia boleh digunakan untuk penaakulan sebab yang lebih kompleks. Rangka kerja latihan aksiomatik yang dicadangkan oleh pasukan adalah paradigma baharu untuk pembelajaran penaakulan sebab berdasarkan data pasif, dengan hanya demonstrasi

See all articles