GPT-4 benar-benar telah diatasi!
Dalam arena model besar, Claude 3 Big Cup Opus ialah raja baharu, dan skor Elo mencapai bahagian atas senarai.
Malah Xiaobei Haiku telah memasuki eselon kedua, mengatasi model GPT-4-0613 dan meninggalkan GPT-3.5-turbo jauh di belakang.
Harga token input Haiku adalah separuh lebih murah daripada GPT-3.5-turbo dari segi output, ia hampir 2 yuan lebih murah daripada GPT-3.5-turbo setiap 1 juta token.
Berbanding dengan GPT-4, harganya cuma 1/20 sahaja. Dan Haiku juga menyokong konteks 200k.
Tidak hairanlah sesetengah pembangun terus terang berkata:
GPT-3.5 terdedah kepada Claude Haiku.
Bukan sahaja harganya lebih murah, Haiku juga telah membawanya ke peringkat seterusnya.
Sebelum Claude 3 menyertai pertandingan, keluarga GPT-4 telah mendominasi ranking selama hampir setahun.
Untuk menambah pengetahuan latar belakang kepada rakan baharu: standard pemarkahan Papan Pendahulu Arena Chatbot LMSYS ialah pemarkahan manusia Soalan yang sama dilemparkan kepada dua model A dan B pada masa yang sama, dan hakim manusia Sila undi mana-mana jawapan yang anda fikir adalah yang terbaik.
Perlu dinyatakan bahawa dalam ucapan tahniah rasmi dari Arena, model Haiku turut diserlahkan khas:
Sesetengah orang telah segera membuka imaginasi mereka dan menghasilkan projek sumber terbuka yang boleh "overclock" kesan Haiku ke tahap Opus yang besar, menarik banyak perhatian. Ringkasnya, biarkan Opus menjadi guru Haiku: Mula-mula gunakan Opus untuk menjana contoh melaksanakan tugas, dan kemudian gunakan kes pengajaran ini untuk meningkatkan tahap postur Haiku.Menurut pilihan pengguna kami, Claude 3 Haiku telah mencapai tahap GPT-4.
Kepantasan, fungsi dan panjang konteksnya adalah unik di pasaran hari ini. . Malah, dengan keberkesanan kos yang sangat tinggi, Claude 3 small cup Haiku sememangnya telah menjadi kegemaran baharu dalam kalangan komuniti pembangun.
Penekanan: Harga Haiku hanya 1/60 daripada Opus, dan kelajuan tindak balasnya adalah 10 kali ganda daripada Opus.
Projek yang dipanggil gpt-prompt-engineer ini pada masa ini mempunyai sejumlah 7.3k bintang di GitHub.
Banyak produk aplikasi juga telah disambungkan ke Haiku buat kali pertama. Contohnya, Vercel boleh menjana UI tapak web secara automatik berdasarkan gesaan. . Model terbaru bersaing, yang gila itu sendiri.
Tetapi sudah tentu apa yang paling dinanti-nantikan oleh pembangun ialah:OpenAI, cepat dan gulung (doge).
Atas ialah kandungan terperinci Claude 3 memintas GPT-4 Arena untuk mencapai puncak! Xiaobei Haiku menjadi kegemaran baharu pembangun: keberkesanan kos yang tiada tandingan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!