OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki-AI-php.cn

Jadual Kandungan

Mengatasi Bias

Hala Tuju Masa Depan: Blok Pembinaan Sistem

Kesimpulan

Rumah

Peranti teknologi

OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki

王林

Apr 10, 2023 pm 08:41 PM

robot ai

OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki

Misi OpenAI adalah untuk memastikan kecerdasan am buatan (AGI) memberi manfaat kepada semua manusia. Oleh itu, kami banyak berfikir tentang kelakuan sistem AI yang kami bina semasa kami melaksanakan AGI, dan cara bagaimana tingkah laku itu ditentukan.

Sejak kami melancarkan ChatGPT, pengguna telah berkongsi output yang mereka percaya berat sebelah dari segi politik atau sebaliknya tidak menyenangkan. Dalam kebanyakan kes, kami percaya kebimbangan yang dibangkitkan adalah sah dan mengenal pasti batasan sebenar sistem kami yang kami harap dapat ditangani. Tetapi pada masa yang sama, kami juga telah melihat beberapa salah faham yang berkaitan dengan cara sistem dan dasar kami berfungsi bersama untuk membentuk output ChatGPT.

Isi utama blog diringkaskan seperti berikut:

Bagaimana tingkah laku ChatGPT dibentuk; 🎜>

Tidak seperti perisian biasa, model kami ialah rangkaian saraf berskala besar. Tingkah laku mereka dipelajari daripada data yang luas dan bukannya diprogramkan secara eksplisit. Untuk menggunakan analogi yang kurang sesuai, proses ini lebih serupa dengan melatih anjing daripada pengaturcaraan biasa. Pertama, model itu melalui fasa "pra-latihan". Pada peringkat ini, model belajar untuk meramalkan perkataan seterusnya dalam ayat dengan terdedah kepada sejumlah besar teks Internet (dan sejumlah besar pendapat). Seterusnya ialah peringkat kedua, di mana kita "memperhalusi" model untuk mengecilkan skop tingkah laku sistem.

Setakat ini, prosesnya tidak sempurna. Kadangkala, proses penalaan halus gagal memenuhi kedua-dua niat kami (untuk menghasilkan alat yang selamat dan berguna) dan niat pengguna (untuk mendapatkan output yang berguna sebagai tindak balas kepada input yang diberikan). Apabila sistem AI menjadi lebih berkuasa, menambah baik cara kami menyelaraskan sistem AI dengan nilai manusia menjadi keutamaan bagi syarikat kami.

Dua langkah utama: pra-latihan dan penalaan halus

Dua langkah utama untuk membina ChatGPT adalah seperti berikut:

OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki

Pertama, kami "pralatih" model dan biarkan mereka meramalkan langkah seterusnya pada set data besar yang mengandungi bahagian Internet. Mereka mungkin belajar untuk melengkapkan ayat "Dia tidak belok kiri, dia berpaling ke __." Dengan belajar daripada berbilion ayat, model kami menguasai tatabahasa, banyak fakta tentang dunia, dan beberapa kebolehan menaakul. Mereka juga mempelajari beberapa bias yang terdapat dalam berbilion-bilion ayat tersebut.

Kami kemudian "memperhalusi" model ini pada set data yang lebih sempit, yang dibuat oleh penyemak manusia yang mengikut garis panduan yang kami sediakan. Oleh kerana kami tidak dapat meramalkan semua maklumat yang mungkin dimasukkan oleh pengguna akan datang ke dalam sistem kami, kami tidak menulis arahan terperinci untuk setiap input yang akan dihadapi oleh ChatGPT. Sebaliknya, kami menggariskan dalam panduan beberapa kategori yang pengulas kami gunakan untuk menyemak dan menilai kemungkinan keluaran model untuk pelbagai input contoh. Kemudian, semasa penggunaan, model membuat generalisasi daripada maklum balas pengulas untuk bertindak balas kepada pelbagai input khusus yang disediakan oleh pengguna tertentu.

Peranan penyemak & strategi OpenAI dalam pembangunan sistem

Dalam sesetengah kes, kami mungkin memberikan penyemak kami maklumat tentang jenis Bimbingan output tertentu (mis., " Jangan lengkapkan permintaan untuk kandungan haram"). Dalam kes lain, panduan yang kami kongsi dengan pengulas adalah tahap yang lebih tinggi (mis., "Elakkan menyebelahi topik kontroversi"). Yang penting, kerja kami dengan pengulas bukanlah urusan satu-dan-selesai tetapi hubungan yang berterusan. Sepanjang hubungan ini, kami belajar banyak daripada kepakaran mereka.

Sebahagian besar daripada proses penalaan halus ialah mengekalkan gelung maklum balas yang kukuh dengan pengulas kami, yang melibatkan mesyuarat mingguan untuk menangani soalan yang mungkin mereka ada atau penjelasan lanjut tentang panduan kami. Proses maklum balas berulang ini ialah cara kami melatih model kami untuk menjadikannya lebih baik dan lebih baik dari semasa ke semasa.

Mengatasi Bias

Bagi sistem AI, masalah berat sebelah telah wujud sejak sekian lama, dan ramai penyelidik telah menyatakan kebimbangan mengenainya. Kami sangat komited untuk menangani isu ini dan membuat hasrat dan kemajuan kami kepada umum. Untuk menyatakan kemajuan di lapangan, di sini kami berkongsi beberapa panduan mengenai topik yang berkaitan dengan politik dan kontroversi. Panduan tersebut dengan jelas menyatakan bahawa pengulas seharusnya tidak memihak kepada mana-mana kumpulan politik. Walau bagaimanapun, berat sebelah mungkin timbul.

OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki

Alamat panduan: https://cdn.openai.com/snapshot-of-chatgpt-model -behavior-guidelines.pdf

Walaupun perselisihan faham akan sentiasa wujud, kami berharap melalui blog ini dan beberapa panduan, anda boleh memperoleh pemahaman yang lebih mendalam tentang cara kami berfikir tentang berat sebelah. Kami amat percaya bahawa syarikat teknologi mesti bertanggungjawab membangunkan dasar yang sesuai untuk diteliti.

Kami telah berusaha keras untuk menambah baik kejelasan garis panduan ini dan berdasarkan apa yang telah kami pelajari setakat ini daripada keluaran ChatGPT, kami akan memberikan penyemak maklumat tentang kemungkinan perangkap yang berkaitan dengan berat sebelah dan cabaran, serta penerangan yang lebih jelas tentang data dan topik kontroversi. Selain itu, sebagai sebahagian daripada inisiatif ketelusan yang berterusan, kami sedang berusaha untuk berkongsi statistik agregat tentang penyemak dengan cara yang tidak melanggar peraturan dan norma privasi, kerana ini merupakan satu lagi sumber potensi berat sebelah dalam output sistem.

Membina kemajuan seperti ganjaran peraturan dan AI Perlembagaan (kaedah kecerdasan buatan asli), kami sedang mengkaji cara untuk menjadikan proses penalaan halus lebih mudah difahami dan dikawal.

Hala Tuju Masa Depan: Blok Pembinaan Sistem

Untuk mencapai misi kami, kami komited untuk memastikan bahawa lebih ramai orang boleh menggunakan dan mendapat manfaat daripada AI dan AGI. Kami percaya bahawa untuk mencapai matlamat ini, sekurang-kurangnya tiga blok binaan diperlukan

1 Memperbaik tingkah laku lalai: Kami berharap sistem AI boleh digunakan di luar kotak supaya seberapa ramai pengguna yang boleh dapat menemui kami sistem AI berfungsi dan berfikir teknologi kami memahami dan menghormati nilai mereka.

Untuk melakukan ini, kami telah melabur dalam penyelidikan dan kejuruteraan untuk mengurangkan berat sebelah halus yang dijana oleh ChatGPT dalam bertindak balas kepada input yang berbeza. Dalam sesetengah kes, ChatGPT enggan mengeluarkan kandungan yang sepatutnya dikeluarkan, dan dalam beberapa kes ia melakukan sebaliknya dan mengeluarkan kandungan yang tidak sepatutnya dikeluarkan. Kami percaya bahawa ChatGPT mempunyai potensi untuk penambahbaikan dalam kedua-dua bidang.

Selain itu, terdapat ruang untuk penambahbaikan dalam aspek lain sistem AI kami Sebagai contoh, sistem sering "membuat sesuatu", yang mana maklum balas pengguna sangat berharga dalam meningkatkan ChatGPT .

2. Tentukan nilai AI secara meluas: Kami percaya AI harus menjadi alat yang berguna kepada individu, jadi setiap pengguna boleh menyesuaikannya dengan beberapa kekangan. Berdasarkan ini, kami sedang membangunkan peningkatan kepada ChatGPT untuk membolehkan pengguna menyesuaikan tingkah lakunya dengan mudah.

Ini juga bermakna output yang sesetengah orang sangat tidak bersetuju dapat dilihat oleh orang lain. Mencapai keseimbangan ini adalah satu cabaran yang besar, kerana mengambil penyesuaian secara melampau boleh membawa kepada penggunaan teknologi kami yang berniat jahat dan secara membuta tuli meningkatkan prestasi AI.

Oleh itu, sentiasa terdapat beberapa had pada tingkah laku sistem. Cabarannya ialah untuk menentukan apakah sempadan tersebut. Jika kita cuba membuat semua keputusan ini sendiri, atau jika kita cuba membangunkan sistem AI monolitik tunggal, kita akan gagal memenuhi janji kita untuk mengelakkan penumpuan kuasa yang berlebihan.

3. Input Awam (Lalai dan Sempadan Keras): Satu cara untuk mengelakkan penumpuan kuasa yang berlebihan adalah dengan membenarkan mereka yang menggunakan atau dipengaruhi oleh sistem seperti ChatGPT untuk mempengaruhi peraturan daripada sistem.

Kami percaya bahawa nilai lalai dan sempadan keras harus dipusatkan, dan walaupun sukar untuk dilaksanakan, matlamat kami adalah untuk memasukkan sebanyak mungkin perspektif. Sebagai titik permulaan, kami mencari input luaran ke dalam teknologi kami dalam bentuk "perkumpulan merah." Kami juga baru-baru ini mula meminta input orang ramai tentang pendidikan AI (konteks yang sangat penting di mana kami menggunakan).

Kesimpulan

Menggabungkan tiga blok bangunan di atas, kita boleh melukis rangka kerja berikut

OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki

Kadang-kadang kita akan melakukan kesilapan, tetapi apabila kita melakukannya, kita akan belajar dan mengulangi model dan sistem. Selain itu, kami ingin mengucapkan terima kasih kepada pengguna ChatGPT dan orang lain kerana memastikan kami sentiasa berhati-hati dan berwaspada, dan kami teruja untuk berkongsi lebih banyak tentang kerja kami dalam tiga bidang ini pada bulan-bulan akan datang.

Atas ialah kandungan terperinci OpenAI mendedahkan pelan peningkatan ChatGPT: semua pepijat yang anda temui sedang diperbaiki. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

1 bulan yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7675

Tutorial CakePHP

1393

Tutorial C#

1207

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Tunjukkan Lagi

Related knowledge

Platform Perdagangan Web3 Ranking_Web3 Global Exchanges Top Ten Ringkasan Apr 21, 2025 am 10:45 AM

Binance adalah tuan rumah ekosistem perdagangan aset digital global, dan ciri -cirinya termasuk: 1. Jumlah dagangan harian purata melebihi $ 150 bilion, menyokong 500 pasangan perdagangan, yang meliputi 98% mata wang arus perdana; 2. Matriks inovasi meliputi pasaran Derivatif, susun atur Web3 dan sistem pendidikan; 3. Kelebihan teknikal adalah enjin yang sepadan dengan milisaat, dengan jumlah pemprosesan puncak sebanyak 1.4 juta transaksi sesaat; 4. Kemajuan pematuhan memegang lesen 15 negara dan menetapkan entiti yang mematuhi di Eropah dan Amerika Syarikat.

Ramalan Harga Worldcoin (WLD) 2025-2031: Adakah WLD akan mencapai $ 4 menjelang 2031? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD) menonjol dalam pasaran cryptocurrency dengan mekanisme pengesahan biometrik dan perlindungan privasi yang unik, menarik perhatian banyak pelabur. WLD telah melakukan yang luar biasa di kalangan altcoin dengan teknologi inovatifnya, terutamanya dalam kombinasi dengan teknologi kecerdasan buatan terbuka. Tetapi bagaimanakah aset digital akan berkelakuan dalam beberapa tahun akan datang? Mari kita meramalkan harga masa depan WLD bersama -sama. Ramalan harga WLD 2025 dijangka mencapai pertumbuhan yang signifikan di WLD pada tahun 2025. Analisis pasaran menunjukkan bahawa harga WLD purata boleh mencapai $ 1.31, dengan maksimum $ 1.36. Walau bagaimanapun, dalam pasaran beruang, harga mungkin jatuh ke sekitar $ 0.55. Harapan pertumbuhan ini disebabkan terutamanya oleh WorldCoin2.

Kedudukan pertukaran leverage dalam lingkaran mata wang Cadangan terkini sepuluh pertukaran leverage dalam lingkaran mata wang Apr 21, 2025 pm 11:24 PM

Platform yang mempunyai prestasi cemerlang dalam perdagangan, keselamatan dan pengalaman pengguna yang dimanfaatkan pada tahun 2025 adalah: 1. Okx, sesuai untuk peniaga frekuensi tinggi, menyediakan sehingga 100 kali leverage; 2. Binance, sesuai untuk peniaga berbilang mata wang di seluruh dunia, memberikan 125 kali leverage tinggi; 3. Gate.io, sesuai untuk pemain derivatif profesional, menyediakan 100 kali leverage; 4. Bitget, sesuai untuk orang baru dan peniaga sosial, menyediakan sehingga 100 kali leverage; 5. Kraken, sesuai untuk pelabur mantap, menyediakan 5 kali leverage; 6. Bybit, sesuai untuk penjelajah altcoin, menyediakan 20 kali leverage; 7. Kucoin, sesuai untuk peniaga kos rendah, menyediakan 10 kali leverage; 8. Bitfinex, sesuai untuk bermain senior

Apakah yang dimaksudkan dengan transaksi rantaian rantaian? Apakah urus niaga salib? Apr 21, 2025 pm 11:39 PM

Pertukaran yang menyokong urus niaga rantaian: 1. Binance, 2. Uniswap, 3 Sushiswap, 4. Kewangan Curve, 5. Thorchain, 6. 1 inci Pertukaran, 7.

Mengapa kenaikan atau kejatuhan harga mata wang maya? Mengapa kenaikan atau kejatuhan harga mata wang maya? Apr 21, 2025 am 08:57 AM

Faktor kenaikan harga mata wang maya termasuk: 1. Peningkatan permintaan pasaran, 2. Menurunkan bekalan, 3. Berita positif yang dirangsang, 4. Sentimen pasaran optimis, 5. Persekitaran makroekonomi; Faktor penurunan termasuk: 1. Mengurangkan permintaan pasaran, 2. Peningkatan bekalan, 3.

Platform Pertukaran Cryptocurrency Top 10 senarai pertukaran mata wang digital terbesar di dunia Apr 21, 2025 pm 07:15 PM

Pertukaran memainkan peranan penting dalam pasaran cryptocurrency hari ini. Mereka bukan sahaja platform untuk pelabur untuk berdagang, tetapi juga sumber kecairan pasaran dan penemuan harga. Pertukaran mata wang maya terbesar di dunia di kalangan sepuluh teratas, dan pertukaran ini bukan sahaja jauh ke hadapan dalam jumlah dagangan, tetapi juga mempunyai kelebihan mereka sendiri dalam pengalaman pengguna, perkhidmatan keselamatan dan inovatif. Pertukaran yang atas senarai biasanya mempunyai pangkalan pengguna yang besar dan pengaruh pasaran yang luas, dan jumlah dagangan dan jenis aset mereka sering sukar dicapai oleh bursa lain.

Cara Memenangi Ganjaran Airdrop Kernel pada Strategi Proses Penuh Binance Apr 21, 2025 pm 01:03 PM

Dalam dunia kriptografi yang ramai, peluang baru selalu muncul. Pada masa ini, aktiviti udara Kerneldao (kernel) menarik banyak perhatian dan menarik perhatian banyak pelabur. Jadi, apakah asalnya projek ini? Apakah faedah yang boleh diperoleh oleh pemegang BNB? Jangan risau, perkara berikut akan mendedahkannya satu demi satu untuk anda.

Apakah platform perdagangan blockchain hibrid? Apr 21, 2025 pm 11:36 PM

Cadangan untuk memilih pertukaran cryptocurrency: 1. Untuk keperluan kecairan, keutamaan adalah Binance, Gate.io atau Okx, kerana kedalaman pesanannya dan rintangan volatilitas yang kuat. 2. Pematuhan dan Keselamatan, Coinbase, Kraken dan Gemini mempunyai sokongan pengawalseliaan yang ketat. 3. Fungsi inovatif, reka bentuk derivatif Kucoin yang lembut dan Bybit sesuai untuk pengguna lanjutan.

See all articles