Jadual Kandungan
Kuasa PaLm + RLHF" >Kuasa PaLm + RLHF
Adakah ia sangat sempurna? " >Adakah ia sangat sempurna?
Sumber terbuka ChatGPT seterusnya" >Sumber terbuka ChatGPT seterusnya
Rumah Peranti teknologi AI Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Apr 12, 2023 pm 06:31 PM
ai chatgpt

Kemunculan ChatGPT mungkin merupakan penemuan AI yang paling menarik perhatian pada separuh kedua 2022, walaupun ia mungkin bukan yang paling teknikal.

Tidak lama dahulu, pada NeurIPS 2022 yang diadakan di New Orleans, khabar angin tentang GPT-4 tidak berkesudahan Pada masa yang sama, OpenAI juga menjadi tumpuan tumpuan media.

OpenAI mengumumkan model baharu dalam siri GPT-3 model bahasa berskala besar AI: text-davinci-003, iaitu "GPT-3.5" siri" bahagian yang boleh meningkatkan prestasi dengan memproses arahan yang lebih kompleks dan menghasilkan kandungan yang lebih berkualiti dan lebih panjang.

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Model baharu dibina di atas InstructGPT dan menggunakan pembelajaran pengukuhan dengan maklum balas manusia untuk menjadikan model bahasa lebih serasi dengan manusia Arahan lebih diselaraskan.

DaVinci-003 ialah pembelajaran pengukuhan sebenar dengan model maklum balas manusia (RLHF) yang telah terbukti berjaya dalam demonstrasi manusia dan sampel model skor tinggi Gunakan diawasi penalaan halus untuk meningkatkan kualiti penjanaan. "

Sebagai bahagian lain daripada "siri GPT-3.5", OpenAI mengeluarkan demonstrasi awal ChatGPT. Syarikat itu mendakwa model perbualan interaktif ini, Bukan sahaja bolehkah anda menjawab sejumlah besar soalan susulan, tetapi anda juga boleh mengakui kesilapan, mencabar premis yang salah dan menolak permintaan yang tidak sesuai.

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

OpenAI menyatakan dalam blog bahawa keluaran penyelidikan ChatGPT ialah “OpenAI secara berulang menggunakan AI yang semakin selamat dan berguna dalam sistem. Ia mengambil banyak pengajaran daripada penggunaan model terdahulu seperti GPT-3 dan Codex, menghasilkan pengurangan ketara dalam hasil keluaran yang berbahaya dan tidak realistik apabila memanfaatkan Pembelajaran Pengukuhan dengan Maklum Balas Manusia 🎜>

Selain itu, ChatGPT menekankan semasa latihan bahawa ia adalah model pembelajaran mesin Ini mungkin untuk mengelakkan persoalan "sama ada AI sedar" yang disebabkan oleh pertikaian Google's chatbot LaMDA tidak lama dahulu.

Sudah tentu, ChatGPT juga mempunyai had.

Dalam catatan blog, OpenAI memperincikan batasannya, termasuk kadangkala jawapan mungkin terdengar munasabah tetapi sebenarnya tidak betul atau fakta yang tidak masuk akal.

"Menyelesaikan masalah ini sangat mencabar kerana (1) pada masa ini tiada jaminan sumber yang boleh dipercayai semasa latihan pembelajaran pengukuhan; (2) ) melatih model dengan lebih berhati-hati dan menolak soalan yang mungkin dijawab dengan betul; (3) latihan yang diselia boleh mengelirukan model kerana jawapan yang ideal bergantung pada apa yang diketahui oleh model, bukan apa yang diketahui oleh manusia 》

Open AI mengatakan bahawa ChatGPT "kadangkala bertindak balas terhadap arahan berbahaya atau menunjukkan tingkah laku berat sebelah. Kami menggunakan API untuk memberi amaran atau menyekat jenis kandungan tidak selamat tertentu, tetapi Jangkakan beberapa negatif dan positif palsu pada masa ini. Kami sangat berminat untuk mengumpul maklum balas pengguna untuk membantu kerja berterusan kami untuk menambah baik model ini."

Walaupun ChatGPT mungkin masih mempunyai banyak masalah yang memerlukan penambahbaikan, kami tidak dapat menafikan bahawa sebelum debut GPT-4, ChatGPT masih berada di puncak besar semasa. -model aliran bahasa.

Namun, baru-baru ini dalam komuniti, terdapat model baharu yang telah mencetuskan semangat semua orang untuk berbincang. Perkara yang paling penting ialah ia adalah sumber terbuka.

Minggu ini, Philip Wang, pembangun yang bertanggungjawab untuk sistem AI sumber tertutup kejuruteraan songsang termasuk Make-A-Video Meta, mengeluarkan PaLM + RLHF, yang merupakan penjanaan teks model yang berkelakuan serupa dengan ChatGPT.

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Alamat kod: https://github.com/lucidrains/PaLM-rlhf-pytorch

Sistem ini menggabungkan model bahasa berskala besar Google PaLM dan pembelajaran pengukuhan dengan teknologi maklum balas manusia (RLHF) untuk mencipta sistem yang boleh menyelesaikan hampir semua tugas dalam ChatGPT, termasuk mendraf e-mel dan mencadangkan kod komputer.

Kuasa PaLm + RLHF

Sejak dikeluarkan, ChatGPT telah diiktiraf kerana keupayaannya menjana tinggi -takrifan teks seperti manusia , dan keupayaannya untuk menjawab soalan pengguna dengan cara perbualan, telah melanda dunia teknologi.

Walaupun ini merupakan kemajuan besar pada peringkat awal pembangunan chatbot, ramai peminat dalam bidang kecerdasan buatan telah menyatakan kebimbangan tentang sifat tertutup ChatGPT.

Sehingga hari ini, model ChatGPT kekal proprietari, bermakna kod asasnya tidak boleh dilihat oleh orang ramai. Hanya OpenAI yang benar-benar tahu cara ia berfungsi dan data yang diprosesnya. Kekurangan ketelusan ini boleh membawa akibat yang meluas dan boleh menjejaskan kepercayaan pengguna dalam jangka panjang.

Ramai pembangun tidak sabar-sabar untuk membina alternatif sumber terbuka, dan kini, ia akhirnya di sini. PaLM+RLHF dibina khusus untuk bahasa Python dan boleh dilaksanakan untuk PyTorch.

Pembangun boleh melatih PaLM semudah pengubah autoregresif dan kemudian menggunakan maklum balas manusia untuk melatih model ganjaran.

Seperti ChatGPT, PaLM + RLHF pada asasnya ialah alat statistik untuk meramal perkataan. Apabila diberi sejumlah besar contoh daripada data latihan—seperti siaran daripada Reddit, artikel berita dan e-buku—PaLM+RLHF mengetahui kemungkinan sesuatu perkataan itu akan berlaku berdasarkan corak seperti konteks semantik teks sekeliling.

Adakah ia sangat sempurna?

Sudah tentu, masih terdapat jurang yang besar antara ideal dan realiti. PaLM + RLHF nampak sempurna, tetapi terdapat juga pelbagai masalah. Masalah terbesar ialah orang masih belum boleh menggunakannya.

Untuk melancarkan PaLM + RLHF, pengguna perlu menyusun gigabait teks yang diperoleh daripada pelbagai sumber seperti blog, media sosial, artikel berita, e-buku, dsb. .

Data ini disalurkan kepada model PaLm yang diperhalusi, yang menjana beberapa respons. Sebagai contoh, jika anda bertanya kepada model "Apakah pengetahuan asas ekonomi?", PaLm akan memberikan jawapan seperti "Ekonomi ialah sains sosial yang mengkaji...".

Selepas itu, pembangun akan meminta orang ramai untuk menilai jawapan yang dijana oleh model daripada yang terbaik kepada yang paling teruk dan mencipta model ganjaran. Akhir sekali, kedudukan digunakan untuk melatih "model ganjaran", yang mengambil respons model asal dan menyusunnya mengikut keutamaan, menapis jawapan terbaik untuk gesaan yang diberikan.

Walau bagaimanapun, ini adalah proses yang mahal. Mengumpul data latihan dan melatih model itu sendiri bukanlah murah. PaLM mempunyai 540 bilion parameter, yang merupakan bahagian model bahasa yang dipelajari daripada data latihan. Kajian 2020 menunjukkan bahawa membangunkan model penjanaan teks dengan hanya 1.5 bilion parameter akan menelan belanja sehingga $1.6 juta.

Pada Julai tahun ini, untuk melatih model sumber terbuka Bloom dengan 176 bilion parameter, penyelidik Hugging Face menghabiskan masa tiga bulan dan menggunakan 384 NVIDIA A100 GPU. Setiap A100 berharga beribu-ribu dolar, yang bukan kos yang mampu dimiliki oleh mana-mana pengguna biasa.

Tambahan pula, walaupun selepas latihan model selesai, menjalankan model bersaiz PaLM + RLHF bukanlah perkara remeh. Bloom mempunyai PC khusus dengan lapan GPU A100, dan GPT-3 generasi teks OpenAI (dengan kira-kira 175 bilion parameter) berharga kira-kira $87,000 setahun untuk dijalankan.

Meningkatkan aliran kerja pembangunan yang diperlukan juga boleh menjadi satu cabaran, penyelidik AI Sebastian Raschka menyatakan dalam artikel tentang PaLM + RLHF.

"Walaupun seseorang memberi anda 500 GPU untuk melatih model ini, anda masih perlu berurusan dengan infrastruktur dan mempunyai rangka kerja perisian yang boleh mengendalikannya," katanya. "Walaupun ini boleh dilaksanakan, pada masa ini ia memerlukan banyak usaha."

Sumber terbuka ChatGPT seterusnya

Kos yang tinggi dan skala besar kedua-duanya menunjukkan bahawa PaLM + RLHF pada masa ini tidak mempunyai keupayaan untuk menggantikan ChatGPT tanpa syarikat atau individu yang dibiayai dengan baik yang mengambil masalah untuk melatih model tersebut.

Setakat ini, tiada tarikh keluaran tepat untuk PaLM + RLHF. Sebagai rujukan, ia mengambil masa tiga bulan untuk melatih Bloom. Sebagai perbandingan, PaLM + RLHF dengan 540 bilion parameter mungkin perlu menunggu 6-8 bulan untuk menghasilkan versi yang bermakna.

Berita baiknya ialah setakat ini kami mempunyai tiga pemain yang diketahui bekerja pada alternatif sumber terbuka ini kepada ChatGPT:

  • CarperAI
  • LAION
  • Yannic Kilcher

CarperAI merancang untuk bekerjasama dengan EleutherAI dan syarikat pemula Skala AI dan Wajah Pelukan untuk mengeluarkan model AI yang sedia untuk dijalankan, seperti ChatGPT dilatih dengan maklum balas manusia.

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Alamat kod: https://github.com/CarperAI/trlx

LAION, organisasi bukan untung yang menyediakan set data awal untuk Stable Diffusion, juga menerajui projek untuk mereplikasi ChatGPT menggunakan teknologi pembelajaran mesin terkini.

Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!

Alamat kod: https://github.com/LAION-AI/Open-Assistant

LAION bertujuan untuk mencipta "pembantu masa depan" yang bukan sahaja boleh menulis e-mel dan surat lamaran, tetapi juga "melakukan kerja bermakna, menggunakan API, menyelidik maklumat secara dinamik, dsb." Ia berada di peringkat awal, tetapi projek dengan sumber berkaitan telah disiarkan secara langsung di GitHub beberapa minggu yang lalu.

"4chan" dalam model ini ialah forum tanpa nama dalam talian Amerika Kerana identiti netizen adalah tanpa nama, ramai orang tidak gentar dan menyatakan pelbagai pendapat politik. Teguran yang tidak betul. Kilcher secara rasmi menggunakan siaran di 4chan untuk melatih model, dan hasilnya boleh diramal.

Serupa dengan nada umum forum, jawapan GPT-4chan dipenuhi dengan perkauman, seksisme dan anti-Semitisme. Bukan itu sahaja, Kilcher juga menyiarkan model asasnya ke Hugging Face untuk dimuat turun oleh orang lain. Walau bagaimanapun, di bawah kecaman ramai penyelidik AI, pegawai dengan cepat menyekat akses netizen kepada model tersebut.

Sementara kami menantikan kemunculan lebih banyak model bahasa sumber terbuka, yang boleh kami lakukan sekarang ialah menunggu. Sudah tentu, idea yang baik juga untuk terus menggunakan ChatGPT secara percuma.

Perlu diambil perhatian bahawa OpenAI masih jauh ke hadapan dalam pembangunan sebelum mana-mana versi sumber terbuka dilancarkan secara rasmi. Pada tahun 2023, GPT-4 sudah pasti adalah perkara yang dinantikan oleh peminat AI di seluruh dunia.

Kebanyakan gergasi AI telah membuat ramalan mereka sendiri mengenainya adalah baik atau buruk, tetapi seperti yang dikatakan oleh COO OpenAI Sam Altman: "Penyiapan kecerdasan buatan am akan lebih cepat daripada yang dibayangkan oleh kebanyakan orang. , dan ia mengubah semua yang kebanyakan orang bayangkan."

Atas ialah kandungan terperinci Pada hari pertama 2023, sila semak ringkasan akhir tahun ChatGPT!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Petua Konfigurasi Firewall Pelayan Mel Debian Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Kaedah pemasangan sijil SSL Server Server Debian Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Cara Melakukan Pengesahan Tandatangan Digital dengan Debian Openssl Cara Melakukan Pengesahan Tandatangan Digital dengan Debian Openssl Apr 13, 2025 am 11:09 AM

Menggunakan OpenSSL untuk Pengesahan Tandatangan Digital pada Sistem Debian, anda boleh mengikuti langkah -langkah berikut: Penyediaan untuk memasang OpenSSL: Pastikan sistem Debian anda telah dipasang. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya: sudoaptdateudoaptininstallopenssl untuk mendapatkan kunci awam: Pengesahan tandatangan digital memerlukan kunci awam penandatangan. Biasanya, kunci awam akan disediakan dalam bentuk fail, seperti public_key.pe

Baris arahan shutdown centos Baris arahan shutdown centos Apr 14, 2025 pm 09:12 PM

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Cara Melakukan Pengurusan Log Debian Hadoop Cara Melakukan Pengurusan Log Debian Hadoop Apr 13, 2025 am 10:45 AM

Menguruskan Log Hadoop pada Debian, anda boleh mengikuti langkah-langkah berikut dan amalan terbaik: Agregasi log membolehkan pengagregatan log: tetapkan benang.log-agregasi-enable untuk benar dalam fail benang-site.xml untuk membolehkan pengagregatan log. Konfigurasikan dasar pengekalan log: tetapkan yarn.log-aggregasi.Retain-seconds Untuk menentukan masa pengekalan log, seperti 172800 saat (2 hari). Nyatakan Laluan Penyimpanan Log: Melalui Benang

Sony mengesahkan kemungkinan menggunakan GPU khas di PS5 Pro untuk membangunkan AI dengan AMD Sony mengesahkan kemungkinan menggunakan GPU khas di PS5 Pro untuk membangunkan AI dengan AMD Apr 13, 2025 pm 11:45 PM

Mark Cerny, Ketua Arkitek SonyinterActiveEntainment (SIE, Sony Interactive Entertainment), telah mengeluarkan lebih banyak butiran perkakasan dari PlayStation5Pro hos generasi akan datang (PS5Pro), termasuk GPU seni bina AMDRDNA2.x yang dinamakan, dan Kod Arsitektur AMDRDNA2.x yang dinamakan. Tumpuan peningkatan prestasi PS5Pro masih pada tiga tiang, termasuk GPU yang lebih kuat, jejak sinar maju dan fungsi resolusi super PSSR yang berkuasa AI. GPU mengamalkan seni bina AmdrDNA2 yang disesuaikan, yang Sony menamakan RDNA2.x, dan ia mempunyai beberapa seni bina RDNA3.

Cara mengkonfigurasi pelayan https di debian openssl Cara mengkonfigurasi pelayan https di debian openssl Apr 13, 2025 am 11:03 AM

Mengkonfigurasi pelayan HTTPS pada sistem Debian melibatkan beberapa langkah, termasuk memasang perisian yang diperlukan, menghasilkan sijil SSL, dan mengkonfigurasi pelayan web (seperti Apache atau Nginx) untuk menggunakan sijil SSL. Berikut adalah panduan asas, dengan mengandaikan anda menggunakan pelayan Apacheweb. 1. Pasang perisian yang diperlukan terlebih dahulu, pastikan sistem anda terkini dan pasang Apache dan OpenSSL: sudoaptDateSudoaptgradesudoaptinsta

Apakah kaedah sandaran untuk gitlab di centos Apakah kaedah sandaran untuk gitlab di centos Apr 14, 2025 pm 05:33 PM

Dasar sandaran dan pemulihan Gitlab di bawah sistem CentOS untuk memastikan keselamatan data dan pemulihan, Gitlab pada CentOS menyediakan pelbagai kaedah sandaran. Artikel ini akan memperkenalkan beberapa kaedah sandaran biasa, parameter konfigurasi dan proses pemulihan secara terperinci untuk membantu anda menubuhkan strategi sandaran dan pemulihan GitLab lengkap. 1. Backup Manual Gunakan Gitlab-Rakegitlab: Backup: Buat Perintah untuk Melaksanakan Backup Manual. Perintah ini menyokong maklumat utama seperti repositori Gitlab, pangkalan data, pengguna, kumpulan pengguna, kunci, dan kebenaran. Fail sandaran lalai disimpan dalam direktori/var/opt/gitlab/sandaran. Anda boleh mengubah suai /etc /gitlab

See all articles