OpenAI o1 dan o1-mini telah tiba. AI LLM ini berprestasi jauh lebih baik dalam pengekodan, matematik dan masalah sains dan tugasan berbanding model terdahulu seperti GPT-4o dengan mengambil lebih banyak masa untuk berfikir.
Masalah rumit dalam STEM cenderung memerlukan lebih daripada carian dalam talian pantas untuk jawapan yang betul. Dengan memberikan O1 AI lebih masa untuk berfikir, AI boleh membuat alasan dengan lebih teliti dan tepat. Model o1-mini telah ditala secara khusus untuk menjawab soalan STEM dengan kelajuan yang lebih pantas dan permintaan yang lebih rendah terhadap sumber komputer, dan ia lebih baik dalam pengekodan daripada model o1.
Merentasi pelbagai peperiksaan AP piawai dan ujian STEM untuk LLM, model o1 menunjukkan prestasi dengan ketepatan yang tinggi. Khususnya, pada ujian bacaan & penulisan berasaskan kalkulus AP, Kimia AP, AP Fizik 2, LSAT dan SAT, model o1 berprestasi pada atau melebihi tahap gred B (~80% atau lebih tinggi). Model menjawab dengan tepat pada tahap gred A pada soalan fizik peringkat PhD, pada tahap gred B pada soalan matematik Peperiksaan Matematik Jemputan Amerika 2024 yang sukar dan pada tahap gred B tinggi pada masalah pengekodan Codeforces. Oleh kerana o1 telah ditala untuk menjawab soalan STEM, prestasinya pada AP Bahasa Inggeris dan AP English Literature berada pada atau di bawah tahap gred C.
Menariknya, sementara GPT-4o terpinga-pinga dengan cabaran kriptografi penyahkodan “oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz” apabila diberi petunjuk “oyfjdnisdr rtqwainr”, oyfjdnisdr rtqwainr acxz mynznvaatzacdfoulxxz bermaksud “Tbhinr acxz” memikirkan masalah untuk mendapatkan jawapan yang betul "Terdapat tiga r dalam strawberi". Kuasa baharu ini akan menggembirakan ahli kriptografi hobi di rumah serta NSA.
Penjahat almari pasti ingin tahu bahawa walaupun model o1 yang tidak ditapis cenderung untuk memberikan balasan yang merisaukan, OpenAI telah mengebiri model ini untuk dikeluarkan. Model o1 telah diuji untuk menahan menjawab soalan tentang membuat bioweapon, menghasilkan imej nakal, jailbreak sendiri dan mengganggu serta mengancam. Malangnya, model OpenAI o1 kekal berat sebelah jantina dan bangsa apabila diuji, walaupun terdapat usaha penalaan.
Pengguna ChatGPT Plus dan Pasukan bersama pembangun peringkat 5 penggunaan API mempunyai akses kepada model o1 serta-merta, dan pengguna ChatGPT Edu dan Enterprise akan mendapat akses pada minggu 16 September. Pengguna Percuma ChatGPT akan mendapat akses kepada o1- mini dalam masa terdekat. Model o1 tidak boleh menyemak imbas web atau menerima fail dan imej yang dimuat naik untuk menjawab soalan, jadi OpenAI mengesyorkan pengguna terus menggunakan model GPT-4o mereka untuk soalan umum.
Pengguna yang ingin bertanya soalan AI kini mempunyai pelbagai model LLM yang berkebolehan untuk berinteraksi selain daripada OpenAI, termasuk Anthropic Claude, Microsoft CoPilot, Google Gemini dan X Grok. Setiap AI mempunyai kelebihan khusus, jadi ia patut menguji beberapa model AI untuk mencari model yang paling sesuai dengan keperluan individu. Sesetengah AI ini dibina ke dalam cermin mata pintar (seperti ini di Amazon) dan perakam suara (seperti ini di Amazon), dan beberapa robot humanoid autonomi akan datang menggunakan AI proprietari untuk memasak dan membersihkan.
Atas ialah kandungan terperinci OpenAI o1 dan o1-mini tiba sebagai AI yang mengendalikan soalan STEM dengan lebih baik daripada model terdahulu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!