Berita pada 16 Mac, syarikat penyelidikan kecerdasan buatan OpenAI mengeluarkan model AI generasi teks yang dinanti-nantikan GPT-4 semalam. Greg Brockman, pengasas bersama dan presiden OpenAI, berkata dalam temu bual bahawa GPT-4 tidak sempurna, tetapi ia pasti berbeza.
GPT-4 menambah baik pada GPT-3 pendahulunya dalam beberapa cara utama, seperti menyediakan perwakilan yang lebih jujur dan membenarkan pembangun mengawal gaya dan tingkah lakunya dengan lebih mudah. GPT-4 juga multimodal dalam erti kata bahawa ia boleh memahami imej, menambah anotasi pada foto, dan juga menerangkan secara terperinci apa yang ada dalam foto.
Tetapi GPT-4 juga mempunyai kelemahan yang serius. Sama seperti GPT-3, model mengalami "ilusi" (iaitu, teks yang diagregatkan oleh model tidak relevan atau cukup tidak tepat kepada teks sumber) dan membuat ralat inferens asas. OpenAI memberi contoh di blognya GPT-4 menyifatkan "Elvis Presley" sebagai "anak seorang pelakon", tetapi sebenarnya kedua ibu bapanya bukan pelakon.
Apabila diminta membandingkan GPT-4 dengan GPT-3, Brockman hanya memberikan jawapan empat perkataan: berbeza. Beliau menjelaskan: "GPT-4 pasti berbeza, walaupun ia masih mempunyai banyak masalah dan pepijat. Tetapi anda boleh melihat lonjakan dalam kemahiran dalam mata pelajaran seperti kalkulus atau undang-undang. Ia telah menunjukkan prestasi yang sangat buruk di beberapa kawasan, tetapi kini ia telah mencapai tahap melebihi orang biasa.”
Keputusan ujian menyokong pandangan Brockman. Dalam ujian kalkulus kemasukan kolej, GPT-4 mendapat 4 mata (daripada 5 mata), GPT-3 mendapat 1 mata, dan GPT-3.5, iaitu antara GPT-3 dan GPT-4, juga mendapat 4 mata. . Dalam peperiksaan bar olok-olok, markah GPT-4 memasuki 10% teratas, manakala markah GPT-3.5 berlegar di sekitar 10% terbawah.
Pada masa yang sama, apa yang menarik perhatian lebih kepada GPT-4 ialah mod berbilang yang disebutkan di atas. Tidak seperti GPT-3 dan GPT-3.5, yang hanya boleh menerima gesaan teks, seperti meminta "menulis artikel tentang zirafah", GPT-4 boleh menerima kedua-dua gesaan imej dan teks untuk melaksanakan operasi tertentu, seperti mengenal pasti orang dalam Satu imej zirafah yang ditangkap di Serengeti, dengan penerangan asas kandungannya.
Ini kerana GPT-4 dilatih pada data imej dan teks, manakala pendahulunya dilatih pada teks sahaja. OpenAI berkata data latihan itu datang daripada "pelbagai sumber data yang dibenarkan secara sah, tersedia untuk umum, yang mungkin termasuk maklumat peribadi yang tersedia secara umum," tetapi apabila diminta memberikan butiran, Brockman menolak. Data latihan telah menyebabkan OpenAI dalam masalah undang-undang sebelum ini.
Keupayaan pemahaman imej GPT-4 agak mengagumkan. Contohnya, menaip gesaan "Apa yang lucu tentang imej ini?" sebuah aplikasi bantuan untuk orang cacat penglihatan yang dipanggil Be My Eyes, kata Brockman, kerana OpenAI menilai risiko dan kebaikan dan keburukan pelancaran yang lebih luas Ia akan menjadi "perlahan dan disengajakan"
Dia juga berkata: "Terdapat. isu dasar yang perlu ditangani, seperti pengecaman muka dan cara menangani imej orang. Kita perlu mengetahui di mana zon bahaya, di mana garis merah berada, dan kemudian mencari penyelesaian dari semasa ke semasa. ”
OpenAI menghadapi dilema etika yang sama dengan sistem penukaran teks ke imejnya Dall-E 2. Selepas melumpuhkan ciri pada mulanya, OpenAI membenarkan pelanggan memuat naik wajah untuk digunakan dengan sistem penjanaan imej berkuasa AI . Pada masa itu, OpenAI mendakwa bahawa peningkatan kepada sistem keselamatannya membolehkan ciri penyuntingan muka kerana ia meminimumkan potensi bahaya daripada deepfakes dan cubaan untuk mencipta kandungan pornografi, politik dan ganas
Satu lagi Isu jangka panjang menghalang GPT-4 daripada digunakan secara tidak sengaja dengan cara yang boleh menyebabkan kemudaratan Beberapa jam selepas model itu dikeluarkan, syarikat permulaan keselamatan siber Israel Adversa AI menerbitkan catatan blog yang menunjukkan memintas penapis kandungan OpenAI dan cara GPT-4 menjana pancingan data e-mel, penerangan yang menyinggung tentang gay, dan teks lain yang tidak menyenangkan bukanlah masalah baharu dalam dunia model bahasa, seperti BlenderBot, bot sembang daripada syarikat induk Facebook Meta dan OpenAI's ChatGPT juga telah tergoda untuk mengeluarkan kandungan yang tidak sesuai malah mendedahkan yang sensitif butiran kerja dalaman mereka, tetapi ramai, termasuk wartawan, berharap bahawa GPT-4 mungkin membawa peningkatan yang ketara dalam hal ini
Apabila ditanya tentang kekukuhan GPT-4, Brockman menekankan bahawa model itu telah dilatih selama enam. bulan pada keselamatan, dan dalam ujian dalaman ia berbuat demikian terhadap permintaan kandungan yang tidak dibenarkan oleh dasar penggunaan OpenAI "Kami menghabiskan banyak masa cuba memahami GPT," kata Brockman. Kami sentiasa mengemas kininya untuk menyertakan pelbagai penambahbaikan supaya model itu lebih berskala agar sesuai dengan personaliti atau mod yang orang mahukan. ”
Sejujurnya, keputusan ujian awal dunia nyata tidak begitu memuaskan. Sebagai tambahan kepada ujian Adversa AI, chatbot Bing Chat Microsoft juga terbukti sangat mudah untuk jailbreak. Menggunakan input yang direka dengan teliti, pengguna boleh memberitahu chatbot untuk menyatakan kasih sayang, mengancam bahaya, mewajarkan pembunuhan besar-besaran dan mencipta teori konspirasi.
Brockman tidak menafikan bahawa GPT-4 gagal dalam bidang ini, tetapi dia menyerlahkan alat pengehad baharu model itu, termasuk ciri peringkat API yang dipanggil mesej "sistem". Mesej sistem pada asasnya ialah arahan yang menetapkan nada dan menetapkan sempadan untuk interaksi dengan GPT-4. Contohnya, mesej sistem mungkin berbunyi: "Anda seorang tutor yang sentiasa menjawab soalan dalam gaya Socratic. Anda tidak pernah memberi jawapan kepada pelajar anda, tetapi sentiasa cuba bertanya soalan yang betul untuk membantu mereka belajar Berfikir secara bebas. ”
Ideanya ialah mesej sistem bertindak sebagai pagar untuk menghalang GPT-4 daripada terkeluar dari landasan. "Benar-benar memikirkan nada, gaya dan bahan GPT-4 telah menjadi tumpuan besar kami, " kata Brockman "Saya fikir kami mula memahami lebih lanjut tentang cara melakukan kejuruteraan, bagaimana untuk mempunyai proses berulang yang membolehkan anda untuk Dapatkan hasil yang boleh diramalkan yang sebenarnya berguna kepada orang ramai juga menyebut Evals, rangka kerja perisian sumber terbuka OpenAI untuk menilai prestasi model AInya, yang sedang diusahakan oleh OpenAI" sebagai ciri utama modelnya. Evals membolehkan pengguna membangun dan menjalankan penanda aras yang menilai model seperti GPT-4 sambil menyemak prestasi mereka, pendekatan sumber ramai untuk ujian model.
Brockman berkata: "Dengan Evals, kami dapat melihat dengan lebih baik kes penggunaan yang pengguna ambil berat dan boleh mengujinya. Sebahagian daripada sebab kami sumber terbuka rangka kerja ini ialah kami tidak perlu lagi menggunakan Evals setiap kali . Keluarkan model baharu setiap tiga bulan untuk terus bertambah baik. Anda tidak membuat sesuatu yang anda tidak boleh mengukur, bukan? jika OpenAI akan memberi pampasan kepada orang ramai untuk menguji modelnya dengan Evals. Dia keberatan untuk melakukan perkara ini, tetapi dia menyedari bahawa untuk masa yang terhad, OpenAI membenarkan akses awal kepada API GPT-4 kepada pengguna Eevals yang memintanya.
Brockman juga bercakap tentang tetingkap konteks GPT-4, yang merujuk kepada teks yang boleh dipertimbangkan oleh model sebelum menjana teks tambahan. OpenAI sedang menguji versi GPT-4 yang boleh "mengingat" kira-kira 50 halaman kandungan, lima kali ganda "memori" GPT-4 biasa dan lapan kali "memori" GPT-3.
Brockman percaya bahawa tetingkap kontekstual yang diperluaskan akan membawa kepada kes penggunaan baharu yang belum diterokai sebelum ini, terutamanya dalam perusahaan. Dia membayangkan sebuah chatbot AI dibina untuk syarikat yang boleh menggunakan latar belakang dan pengetahuan daripada sumber yang berbeza, termasuk pekerja merentas jabatan, untuk menjawab soalan dengan cara yang sangat berpengetahuan tetapi bercakap.
Ini bukan konsep baharu. Tetapi Brockman percaya jawapan GPT-4 akan jauh lebih berguna daripada jawapan yang disediakan oleh chatbot dan enjin carian yang lain. "Sebelum ini, model itu tidak tahu siapa anda, perkara yang anda minati, dsb. Dan mempunyai tetingkap konteks yang lebih besar pasti menjadikannya lebih kukuh, meningkatkan sokongan yang boleh diberikan kepada orang ramai," katanya
Atas ialah kandungan terperinci Presiden OpenAI: GPT-4 tidak sempurna tetapi ia pasti berbeza. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!