ChatGPT lwn GPT-3 lwn GPT-4 hanyalah pergaduhan dalaman sesama keluarga chatbot-AI-php.cn

ChatGPT lwn GPT-3 lwn GPT-4 hanyalah pergaduhan dalaman sesama keluarga chatbot

青灯夜游

Lepaskan： 2023-03-31 22:39:11

ke hadapan

2153 orang telah melayarinya

Apabila menerangkan keupayaan salinan iklan dan penjanaan sepanduk SoMin, orang sering bertanya sama ada GPT-3 telah digantikan oleh ChatGPT atau jika ia masih berjalan dalam mod yang sudah lapuk.

Apabila menerangkan keupayaan salinan iklan dan penjanaan sepanduk SoMin, orang sering bertanya sama ada GPT-3 telah digantikan oleh ChatGPT atau sama ada ia masih berjalan dalam mod usang. "Kami belum dan tidak merancang untuk berbuat demikian." Jurucakap SoMin menjawab, walaupun chatbot ChatGPT yang dilancarkan oleh OpenAI sedang berkembang pesat. Ini sering mengejutkan pelanggan, jadi berikut adalah penjelasan mengapa dia akan memberikan jawapan sedemikian.

ChatGPT lwn GPT-3 lwn GPT-4 hanyalah pergaduhan dalaman sesama keluarga chatbot

Mempunyai tempat dalam model kecerdasan buatan

GPT-2, GPT-3, ChatGPT dan GPT-4 yang dilancarkan baru-baru ini semuanya tergolong dalam kategori yang sama model kecerdasan buatan - Transformer. Ini bermakna, tidak seperti model pembelajaran mesin generasi sebelumnya, mereka dilatih untuk menyelesaikan tugas yang lebih seragam, jadi mereka tidak perlu dilatih semula untuk setiap tugas khusus untuk menghasilkan hasil yang boleh diambil tindakan. Yang terakhir menerangkan saiznya yang besar (175 bilion parameter dalam kes GPT-3), dan model mungkin perlu "mengingat seluruh internet" supaya cukup fleksibel untuk bertukar antara kepingan data yang berbeza berdasarkan input pengguna . Model itu kemudiannya dapat menjana hasil apabila pengguna memasukkan soalan pertanyaan, penerangan tentang tugasan dan beberapa contoh (seperti anda akan meminta pustakawan untuk buku yang diminati). Pendekatan ini dipanggil "pembelajaran beberapa pukulan" dan telah menjadi trend baru-baru ini dalam memberikan input kepada model Transformer moden.

Tetapi adakah perlu mengetahui segala-galanya tentang Internet untuk menyelesaikan tugas semasa Sudah tentu tidak - dalam banyak kes, seperti ChatGPT, sebilangan besar (berjuta-juta) sampel Data tertentu daripada tugasan itu? akan membenarkan model untuk memulakan proses Pembelajaran Pengukuhan daripada Maklum Balas Manusia (RLHF). Seterusnya, RLHF akan memperoleh proses latihan kolaboratif antara AI dan manusia untuk terus melatih model AI untuk menghasilkan perbualan seperti manusia. Oleh itu, ChatGPT bukan sahaja cemerlang dalam senario chatbot, tetapi juga membantu orang menulis kandungan bentuk pendek (seperti puisi atau lirik) atau kandungan bentuk panjang (seperti esei apabila orang perlu mendapatkan jawapan dengan cepat, dalam istilah mudah atau). pengetahuan yang mendalam Menjelaskan topik yang kompleks; menyediakan sumbangsaran, topik dan idea baharu, yang membantu dalam proses kreatif, menyokong jabatan jualan dalam komunikasi yang diperibadikan, seperti menjana e-mel untuk dijawab.

Walaupun model Transformer besar secara teknikalnya mungkin untuk cuba menyelesaikan tugasan ini, ia tidak mungkin dapat dicapai oleh ChatGPT atau GPT-4 - ini disebabkan oleh pemahaman ChatGPT dan Transformers OpenAI yang lain tentang peristiwa dalam dunia Sangat terhad kerana ia adalah model terlatih dan oleh itu data mereka tidak dikemas kini dengan cukup kerap disebabkan oleh permintaan pengiraan latihan semula model yang sangat tinggi. Ini mungkin merupakan kelemahan terbesar semua model pra-latihan yang dihasilkan oleh OpenAI (dan sememangnya orang lain) setakat ini. Masalah yang lebih besar adalah khusus untuk ChatGPT: tidak seperti GPT-3, ia dilatih pada set data perbualan yang sangat fokus, jadi hanya dalam tugas perbualan yang ChatGPT mengatasi prestasi sebelumnya, sambil menyelesaikan tugas manusia yang lain, ia adalah kurang maju.

Keluarga model bahasa besar yang semakin berkembang

Kini diketahui bahawa ChatGPT hanyalah versi GPT-3 yang lebih kecil dan lebih spesifik, tetapi adakah ini bermakna akan ada lebih banyak lagi dalam masa terdekat ? Model sedemikian muncul: MarGPT untuk pemasaran, AdGPT untuk pengiklanan digital, MedGPT untuk menjawab soalan perubatan?

Ini mungkin atas sebab berikut: Apabila syarikat SoMin menyerahkan permohonan kepada Apabila mendapat akses kepada GPT-3 Beta , walaupun mengisi borang permohonan yang panjang lebar menerangkan secara terperinci perisian semasa yang akan dibina, saya diminta bersetuju untuk memberikan maklum balas tentang cara model itu digunakan setiap hari dan keputusan yang diterima. Syarikat OpenAI melakukan ini atas sebab tertentu, terutamanya kerana ia adalah projek penyelidikan dan mereka memerlukan pandangan komersil tentang aplikasi terbaik model itu, dan mereka mengumpul dana ramai sebagai pertukaran untuk peluang untuk mengambil bahagian dalam revolusi kecerdasan buatan yang hebat ini. Apl Chatbot nampaknya antara yang paling popular, jadi ChatGPT diutamakan. ChatGPT bukan sahaja lebih kecil (20 bilion parameter berbanding 175 bilion parameter), tetapi juga lebih pantas dan lebih tepat daripada GPT-3 dalam menyelesaikan tugas perbualan - untuk produk AI kos rendah/berkualiti tinggi Bagi saya, ini adalah perniagaan yang sempurna kes.

Jadi, apabila bercakap tentang AI generatif, adakah lebih baik jawapannya, ia bergantung. Apabila seseorang membina model pembelajaran umum yang mampu menyelesaikan banyak tugas, jawapannya adalah ya, lebih besar lebih baik, seperti yang dibuktikan oleh kelebihan GPT-3 berbanding GPT-2 dan pendahulu lain. Tetapi apabila seseorang ingin melaksanakan tugas tertentu dengan baik, seperti chatbot dalam ChatGPT, maka fokus data dan proses latihan yang betul adalah lebih penting daripada model dan saiz data. Itulah sebabnya di SoMin, daripada menggunakan ChatGPT untuk menjana salinan dan sepanduk, data berkaitan iklan digital khusus digunakan untuk membimbing GPT-3 mencipta kandungan yang lebih baik untuk iklan baharu yang belum dilihat lagi.

Jadi, seseorang mungkin bertanya, bagaimanakah masa depan AI generatif akan berkembang menjadi salah satu kemajuan yang tidak dapat dielakkan yang akan dilihat oleh orang ramai dalam GPT-4 yang akan datang, seperti yang dinyatakan oleh Ketua Pegawai Eksekutif OpenAI Sam Altman dalam ucapannya. Pada masa yang sama, Altman juga mematahkan khabar angin bahawa model itu mempunyai 100 trilion parameter. Oleh itu, orang ramai tahu bahawa lebih besar tidak selalu bermakna lebih baik dalam model kecerdasan buatan ini.

Atas ialah kandungan terperinci ChatGPT lwn GPT-3 lwn GPT-4 hanyalah pergaduhan dalaman sesama keluarga chatbot. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!