6 Model Bahasa Besar Terbaik pada 2023-AI-php.cn

Kini musim AI, dan syarikat teknologi sedang menghasilkan model bahasa yang besar seperti roti dari kedai roti. Model baharu dikeluarkan dengan pantas, dan ia menjadi terlalu sukar untuk dijejaki.

Tetapi di tengah-tengah kesibukan keluaran baharu, hanya beberapa model telah naik ke tempat teratas dan membuktikan diri mereka sebagai pesaing sebenar dalam ruang model bahasa yang besar. Ketika kami menghampiri penghujung tahun 2023, kami telah mengumpulkan enam model bahasa besar yang paling mengagumkan yang perlu anda cuba.

1. GPT-4 OpenAI

The 6 Best Large Language Models in 2023

GPT-4 ialah model bahasa besar yang tersedia secara umum yang paling maju setakat ini. Dibangunkan oleh OpenAI dan dikeluarkan pada Mac 2023, GPT-4 ialah lelaran terkini dalam siri Generative Pre-trained Transformer yang bermula pada 2018. Dengan keupayaannya yang besar, GPT-4 telah menjadi salah satu bahasa besar yang paling banyak digunakan dan paling popular. model di dunia.

Walaupun tidak disahkan secara rasmi, sumber menganggarkan GPT-4 mungkin mengandungi 1.76 trilion parameter yang mengejutkan, kira-kira sepuluh kali ganda daripada pendahulunya, GPT-3.5 dan lima kali lebih besar daripada perdana Google, PaLM 2. Skala besar ini membolehkan GPT-4 kebolehan multimodal, membolehkannya memproses kedua-dua teks dan imej sebagai input. Akibatnya, GPT-4 boleh mentafsir dan menerangkan maklumat visual seperti gambar rajah dan tangkapan skrin sebagai tambahan kepada teks. Sifat multimodalnya memberikan pemahaman yang lebih seperti manusia tentang data dunia sebenar.

Dalam penanda aras saintifik, GPT-4 dengan ketara mengatasi model kontemporari lain dalam pelbagai ujian. Walaupun penanda aras sahaja tidak menunjukkan sepenuhnya kekuatan model, kes penggunaan dunia sebenar telah menunjukkan bahawa GPT-4 sangat mahir dalam menyelesaikan masalah praktikal secara intuitif. GPT-4 kini dibilkan pada $20 sebulan dan boleh diakses melalui pelan Plus ChatGPT.

2. Anthropic's Claude 2

Walaupun tidak sepopular GPT-4, Claude 2, yang dibangunkan oleh Anthropic AI, boleh menandingi penanda aras teknikal GPT -4 dan prestasi dunia sebenar dalam beberapa bidang. Dalam beberapa ujian piawai, termasuk peperiksaan terpilih, Claude 2 mengatasi GPT-4. Model bahasa AI juga mempunyai tetingkap konteks yang sangat unggul pada sekitar 100,000 token, berbanding model token 8k dan 32k GPT -4. Walaupun panjang konteks yang lebih besar tidak selalu diterjemahkan kepada prestasi yang lebih baik, kapasiti berkembang Claude 2 memberikan kelebihan yang jelas, seperti mencerna keseluruhan buku 75,000 perkataan untuk analisis.

Dalam prestasi keseluruhan, GPT-4 kekal unggul, tetapi ujian dalaman kami menunjukkan Claude 2 melebihinya dalam beberapa tugasan penulisan kreatif. Claude 2 juga mengikuti GPT-4 dalam kemahiran pengaturcaraan dan matematik berdasarkan penilaian kami tetapi cemerlang dalam memberikan jawapan kreatif seperti manusia. Apabila kami menggesa semua model dalam senarai ini untuk menulis atau menulis semula karya kreatif, enam kali daripada sepuluh, kami memilih hasil Claude 2 untuk hasil yang terdengar semula jadi seperti manusia. Pada masa ini, Claude 2 tersedia secara percuma melalui chatbot Claude AI. Terdapat juga pelan berbayar $20 untuk akses kepada ciri tambahan.

Walaupun mempunyai kurang sokongan kewangan berbanding gergasi seperti OpenAI dan Microsoft, model AI Claude 2 Anthropic bertahan dengan model GPT yang popular dan siri PaLM Google. Untuk AI dengan sumber yang lebih sedikit, Claude 2 sangat kompetitif. Jika terpaksa bertaruh pada model sedia ada yang mempunyai peluang terbaik untuk menyaingi GPT dalam masa terdekat, Claude 2 nampaknya adalah pertaruhan paling selamat. Walaupun kehabisan senjata dalam pembiayaan, keupayaan lanjutan Claude 2 mencadangkan ia boleh pergi ke hujung kaki dengan raksasa yang dibiayai dengan baik (walaupun perlu diperhatikan bahawa Google telah membuat beberapa sumbangan besar kepada Anthropic). Model menumbuk melebihi kelas beratnya dan menunjukkan janji sebagai pencabar yang baru muncul.

3. GPT-3.5 OpenAI

Walaupun dibayangi oleh keluaran GPT-4, GPT-3.5 dan 175 bilion parameternya tidak boleh dipandang remeh. Melalui penalaan halus berulang dan naik taraf yang memfokuskan pada prestasi, ketepatan dan keselamatan, GPT-3.5 telah jauh daripada model GPT-3 asal. Walaupun ia tidak mempunyai keupayaan multimodal GPT -4 dan ketinggalan dalam panjang konteks dan kiraan parameter, GPT-3.5 kekal berkeupayaan tinggi, dengan GPT-4 merupakan satu-satunya model yang mampu mengatasi prestasi menyeluruhnya dengan tegas.

Walaupun merupakan model peringkat kedua dalam keluarga GPT, GPT-3.5 boleh memegang sendiri dan malah mengatasi model perdana Google dan Meta pada beberapa penanda aras. Dalam ujian sebelah menyebelah kemahiran matematik dan pengaturcaraan terhadap PaLM 2 Google, perbezaannya tidak ketara, dengan GPT-3.5 walaupun mempunyai kelebihan sedikit dalam beberapa kes. Tugasan yang lebih kreatif seperti jenaka dan penulisan naratif menyaksikan GPT-3.5 mendahului dengan tegas.

Jadi, sementara GPT-4 menandakan kejayaan baharu dalam AI, GPT-3.5 kekal sebagai model yang sangat hebat, mampu bersaing dengan dan kadangkala mengatasi alternatif yang paling maju. Penambahbaikan berterusan memastikan ia kekal relevan walaupun bersama model generasi seterusnya yang lebih mencolok.

4. Google's PaLM 2

Apabila menilai keupayaan model AI, formula yang terbukti ialah membaca laporan teknikal dan menyemak markah penanda aras, tetapi ambil semua yang anda pelajari dengan sebutir garam dan uji model itu sendiri. Walaupun nampaknya tidak intuitif, hasil penanda aras tidak selalu sejajar dengan prestasi dunia sebenar untuk sesetengah model AI. Di atas kertas, PaLM 2 Google sepatutnya menjadi pembunuh GPT-4, dengan keputusan ujian rasmi mencadangkan ia sepadan dengan GPT-4 merentas beberapa penanda aras. Walau bagaimanapun, dalam penggunaan sehari-hari, gambar yang berbeza muncul.

Dalam penaakulan logik, matematik dan kreativiti, PaLM 2 gagal mencapai GPT-4. Ia juga ketinggalan daripada Claude Anthropic dalam pelbagai tugasan penulisan kreatif. Walau bagaimanapun, walaupun ia gagal memenuhi pengebilannya sebagai pembunuh GPT-4, PaLM 2 Google kekal sebagai model bahasa yang berkuasa dalam haknya sendiri, dengan keupayaan yang besar. Kebanyakan sentimen negatif di sekelilingnya berpunca daripada perbandingan dengan model seperti GPT-4 dan bukannya prestasi yang teruk.

Dengan 340 bilion parameter, PaLM 2 berdiri di antara model terbesar di dunia. Ia sangat cemerlang dalam tugas berbilang bahasa dan mempunyai kebolehan matematik dan pengaturcaraan yang kuat. Walaupun bukan yang terbaik, PaLM 2 juga cukup cekap dalam tugas kreatif seperti menulis. Jadi, sementara penanda aras melukiskan gambaran optimistik yang tidak menjadi kenyataan sepenuhnya, PaLM 2 masih menunjukkan kemahiran AI yang mengagumkan, walaupun tidak mengatasi semua pesaing secara menyeluruh.

5. Falcon-180B TII

Melainkan anda telah mengikuti kepantasan keluaran model bahasa AI, anda mungkin tidak pernah menemui Falcon-180B. Dibangunkan oleh Institut Inovasi Teknologi UAE, 180 bilion parameter Falcon-180 ialah salah satu model bahasa sumber terbuka yang paling berkuasa di luar sana, walaupun ia tidak mempunyai pengiktirafan nama model GPT atau penggunaan meluas Meta Llama 2. Tetapi jangan kesilapan - Falcon-180B boleh berdiri teguh dengan yang terbaik dalam kelas.

Keputusan penanda aras mendedahkan bahawa Falcon-180B mengatasi kebanyakan model sumber terbuka dan bersaing dengan juggernauts komersial seperti PaLM 2 dan GPT-3.5. Dalam menguji tugasan matematik, pengekodan, penaakulan dan penulisan kreatif, ia juga pernah mengenepikan GPT-3.5 dan PaLM 2. Jika kedudukan GPT-4, GPT-3.5 dan Falcon-180B, kami akan meletakkan Falcon-180B tepat di antara GPT-4 dan GPT-3.5 untuk kekuatannya dalam beberapa kes penggunaan.

Walaupun kami tidak boleh yakin mengatakan ia adalah lebih baik daripada GPT-3.5 dalam prestasi keseluruhan, ia membuat kes untuk dirinya sendiri. Walaupun tidak jelas, model ini patut diberi perhatian kerana memadankan atau melebihi keupayaan alternatif yang lebih dikenali. Anda boleh mencuba model Falcon-180B pada Hugging Face (platform LLM sumber terbuka).

6. Llama 2 Meta AI

Llama 2, model bahasa besar parameter 70 bilion Meta AI, dibina pada pendahulunya, Llama 1. Walaupun lebih kecil daripada model terkemuka, Llama 2 dengan ketara mengatasi kebanyakan LLM penanda aras sumber terbuka yang tersedia untuk umum dan penggunaan dunia sebenar. Pengecualian ialah Falcon-180B.

Kami menguji Llama 2 terhadap GPT-4, GPT-3.5, Claude 2 dan PaLM 2 untuk mengukur keupayaannya. Tidak mengejutkan, GPT-4 mengatasi Llama 2 dalam hampir semua parameter. Walau bagaimanapun, Llama 2 bertahan menentang GPT-3.5 dan PaLM 2 dalam beberapa penilaian. Walaupun adalah tidak tepat untuk mendakwa Llama 2 lebih unggul daripada PaLM 2, Llama 2 menyelesaikan banyak masalah yang menghalang PaLM 2, termasuk tugas pengekodan. Claude 2 dan GPT-3.5 mengenepikan Llama 2 dalam beberapa kawasan tetapi hanya lebih baik dalam beberapa tugasan yang terhad.

Jadi, walaupun tidak melebihi keupayaan model proprietari terbesar, Llama 2 sumber terbuka mengatasi kelas beratnya. Untuk model yang tersedia secara terbuka, ia menunjukkan prestasi yang mengagumkan, menyaingi gergasi AI seperti PaLM 2 dalam penilaian terpilih. Llama 2 memberikan gambaran tentang potensi masa depan model bahasa sumber terbuka.

Jurang Prestasi Antara Model AI Semakin Mengecil

Walaupun landskap AI berkembang pada kadar yang pesat, GPT-4 OpenAI kekal sebagai peneraju pek. Walau bagaimanapun, sementara GPT-4 kekal tidak dapat ditandingi dalam skala dan prestasi, model seperti Claude 2 menunjukkan bahawa dengan kemahiran yang mencukupi, model yang lebih kecil boleh bersaing di kawasan terpilih. PaLM 2 Google, walaupun tidak mencapai beberapa jangkaan yang tinggi, masih mempamerkan keupayaan yang mendalam. Dan Falcon-180B membuktikan bahawa inisiatif sumber terbuka boleh berdiri bahu-membahu dengan gergasi industri yang diberi sumber yang mencukupi.

Atas ialah kandungan terperinci 6 Model Bahasa Besar Terbaik pada 2023. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!