Ia adalah musim 3 - dari model O3 Openai hingga kini Grok 3, pelancaran terbaru oleh X.AI Elon Musk - ia adalah hujan LLMS. Model terkini yang terdapat dalam dua varian-Grok-3 dan Grok-3 Mini-membawa satu ton ciri kepada Bucket Grok. Walaupun kebanyakan ciri-ciri barunya telah ada di LLM lain untuk beberapa waktu, Grok 3 berdiri sebagai pesaing yang kuat terhadap model yang hebat seperti O3-Mini, GPT-4, dan DeepSeek-V3. Dalam blog ini, kami akan membandingkan O3-Mini dan Grok 3 pada tugas yang berbeza untuk melihat jika Grok 3 sebenarnya memegang potensi atau jika ia hanya satu lagi Hype Elon Musk.
bagaimana untuk mengakses grok 3?
anda boleh mengakses Grok 3 dengan cara berikut:
Juga baca: Openai O3-Mini: Prestasi, Cara Mengakses, dan banyak lagi
bagaimana untuk mengakses o3-mini?
untuk mengakses O3-Mini, pergi ke https://chatgpt.com/, dan pilih 'Alasan' sebelum memasukkan pertanyaan anda. Chatbot kemudian akan menggunakan model lanjutan ini dan berfikir sebelum bertindak balas. Jika anda seorang pengguna berbayar CHATGPT, anda boleh memilih O3-Mini atau O3-Mini (tinggi) secara langsung dari senarai drop-down pemilihan model.
Grok 3 vs O3-Mini: Perbandingan Prestasi
Kami kini akan membandingkan kedua-dua model, Grok 3 dan O3-Mini, dalam empat tugas yang berbeza yang melibatkan penalaran, pengekodan, penyelidikan, dan multimodality. Saya akan mengkaji output yang dihasilkan oleh kedua -dua model dan kemudian memilih yang saya dapati adalah lebih baik. Mari kita mulakan.
Tugas 1: Penalaran
prompt:
output oleh grok 3
output oleh O3-Mini
Grok 3 (Big Brain) | o3-mini |
The model starts by generating a description of the games and how it has merged the features of both games. It mentions how the game will appear during playtime. Then it gives a detailed code working on the mechanics of the game and ensuring all the variables and the movement are defined very well. It defines the logic behind the stacking of the blocks and also establishes the condition for game over. In the output, the stacks follow the defined pattern and make the entire game feel very seamless. | The model starts with defining the problem statement. It then establishes the high-level design of the game including a description of all the components to be covered. The model generates a detailed code but fails to capture the main intricacies of the game. It doesn’t establish any strong stacking logic for the blocks and neither does it give a condition for how or when to end the game. Finally, upon running the output we just get a grid of lines with no stacks falling in real-time. |
Grok 3 mengambil lebih banyak masa untuk bertindak balas tetapi memberikan respons terperinci. Ia berfungsi seperti pengekodan ninja dan menghasilkan kod yang mantap yang meliputi setiap titik ke hujung. O3-Mini cepat tetapi ia tidak mempunyai kedalaman yang diperlukan untuk tugas itu. Percubaannya terasa setengah bakar tanpa logik permainan atau pematuhan kepada graviti tumpukan yang jatuh.
hasil: grok 3: 1 | O3-Mini: 0
Dalam tugas ini, saya akan menilai prestasi pengekodan kedua -dua model berdasarkan pernyataan masalah yang melibatkan pemikiran logik dalam fizik dan matematik.
prompt: "Menjana kod untuk plot 3D animasi pelancaran dari pendaratan Bumi di Marikh dan kemudian kembali ke Bumi pada tetingkap pelancaran seterusnya."
output oleh grok 3output oleh O3-Mini
Review Response Grok 3 berfikir selama 114 saat berbanding 7 saat yang diambil oleh O3-Mini untuk menghasilkan responsnya. Grok 3 aces pada alasan yang berlaku di belakang menentukan gerakan orbital kapal angkasa di sekitar planet. Dan kod berikutnya menghasilkan animasi 3D yang sempurna! O3-mini menyimpan perkara yang mudah dan ia tidak menyumbang gerakan orbital atau tidak termasuk kapal angkasa atau matahari dalam kodnya. Secara keseluruhan gambaran oleh Grok 3 jauh lebih baik daripada yang dihasilkan oleh O3-Mini. hasil: grok 3: 1 | O3-Mini: 0 Dalam tugas ini, saya akan menilai keupayaan "carian mendalam" kedua -dua model. prompt: "Bilakah pelancaran kapal permulaan seterusnya?" output oleh grok 3
output oleh O3-Mini
Kedua -dua model mempunyai respons awal yang hampir sama. Grok 3 dalam mod carian mendalam memberikan tarikh tidak lebih awal daripada 25 Feb, manakala O3-Mini dalam mod pemikiran menghampiri pada Mac 2025. Akhirnya, ia mengambil O3-mini beberapa saat untuk menghasilkan respons manakala Grok 3 mengambil masa lebih 100 saat untuk menghasilkan outputnya. hasil: grok 3: 0 | O3-Mini: 1 Dalam tugas ini, saya akan menguji keupayaan penjanaan imej kedua -dua model dengan meminta mereka untuk membuat grafik vektor berskala (SVG). prompt: "Menjana svg pelican menunggang basikal." output oleh grok 3
Review Response Kedua -dua model boleh menjana imej, tetapi Grok 3 masih belajar. Imej yang dihasilkannya terasa amatur dengan kekurangan sentuhan artistik. Imej yang dihasilkan oleh O3-mini di sisi lain, mempunyai butiran dan ia menangkap intipati sebenar Pelican dan basikal. hasil: grok 3: 0 | O3-Mini: 1
Dengan Grok 3, X.AI Elon Musk telah meletakkan dirinya di atas kekaki yang serupa dengan model Openai O-Series. Walaupun Openai mempunyai perjalanan yang lebih panjang untuk mencapai di mana ia berada, Grok, memanfaatkan kesilapan semua model terkini, seolah -olah telah memanjat tali lebih cepat daripada kebanyakan. Walaupun kedua -dua model kini mempunyai ciri -ciri seperti carian dalam, pemikiran, dan penalaran maju, Grok nampaknya mempunyai kelebihan sedikit dengan ciri "otak besar". Kedua-dua model proprietari mempunyai pertempuran yang sukar di hadapan dengan model sumber terbuka yang luar biasa oleh Meta AI dan syarikat China seperti Deepseek dan Qwen. Menurut Elon Musk, Grok 2 dijangka terbuka pada bulan-bulan akan datang, sementara O3-mini mungkin masih tetap tertutup. Sedangkan Sam Altman telah membuat O3-mini tersedia untuk kegunaan terhad di peringkat bebas OpenAI, kerana kami menunggu sama untuk Grok 3. Ini menyoroti pengiktirafan kedua-dua syarikat terhadap permintaan yang semakin meningkat untuk AI yang boleh diakses dan demokrasi, mengimbangi keterbukaan dengan kemajuan proprietari mereka.
Soalan Lazim
a. O3 dan O3-Mini dibangunkan oleh OpenAI, syarikat di belakang Chatgpt, yang diketuai oleh Sam Altman. Q8. Adakah grok 3 percuma?
grok 3 (think)
o3-mini
Grok 3 (Think)
o3-mini
The model thinks for a long time before generating the code. Its output starts with a description of the code, listing down the libraries that it uses for coding and visualization. Then it gives a detailed code, understanding the physical and mathematical requirements behind creating the 3D animation.
The model quickly starts working on the code. It starts with a small description of the libraries it uses for code and animation and then quickly starts with the code. Although the model took a decent approach, it didn’t account for the motion of the spaceship. Neither does it account for their orbital motion. Moreover, it ends up generating a 3D image and not a 3D animation as was required.
Model ini berfikir untuk masa yang lama sebelum menjana kod. Outputnya bermula dengan penerangan kod, menyenaraikan perpustakaan yang digunakan untuk pengekodan dan visualisasi. Kemudian ia memberikan kod terperinci, memahami keperluan fizikal dan matematik di sebalik membuat animasi 3D.
Model dengan cepat mula bekerja pada kod. Ia bermula dengan penerangan kecil perpustakaan yang digunakan untuk kod dan animasi dan kemudian dengan cepat bermula dengan kod. Walaupun model mengambil pendekatan yang baik, ia tidak menyumbang kepada gerakan kapal angkasa. Ia juga tidak menyumbang kepada gerakan orbital mereka. Selain itu, ia akhirnya menghasilkan imej 3D dan bukan animasi 3D seperti yang diperlukan.
Analisis perbandingan
Tugas 3: Penyelidikan
grok 3 (carian dalam)
Grok 3 (Deep Search)
o3-mini (high)
Although it takes longer to respond, the result is much more comprehensive with the date being a closer approximation. The model clearly mentions that the next launch date is no sooner than Feb 24, 2025. In its response, it also covers its approach towards generating the response as it lists down the sources it referred to. It gives a proper conclusion to the response with a table listing the details it collected from various sources.
It only takes a few seconds to generate the result and gives a decent approximation. This model states that the launch is set for March 2025 and then lists several factors that could affect the launch date. It does give some additional information regarding SpaceX and then closes the response with a few reference links.
o3-mini (tinggi)
Walaupun memerlukan masa yang lebih lama untuk bertindak balas, hasilnya lebih komprehensif dengan tarikh menjadi penghampiran yang lebih dekat. Model ini jelas menyebut bahawa tarikh pelancaran seterusnya tidak lebih awal daripada 24 Feb, 2025. Dalam responsnya, ia juga meliputi pendekatannya untuk menghasilkan respons kerana ia menyenaraikan sumber yang disebutkan. Ia memberikan kesimpulan yang tepat kepada respons dengan jadual yang menyenaraikan butiran yang dikumpulkan dari pelbagai sumber.
Ia hanya mengambil masa beberapa saat untuk menjana hasilnya dan memberikan penghampiran yang baik. Model ini menyatakan bahawa pelancaran itu ditetapkan pada bulan Mac 2025 dan kemudian menyenaraikan beberapa faktor yang boleh menjejaskan tarikh pelancaran. Ia memberikan beberapa maklumat tambahan mengenai SpaceX dan kemudian menutup respons dengan beberapa pautan rujukan.
Analisis perbandingan
Tugas 4: Generasi Imej
grok 3
o3-mini
Grok 3
o3-mini
The model generates a funny image of a bird riding a bicycle. The image looks like it was drawn by a 5-year-old.
The model generates a colorful and vibrant image of a pelican riding a bicycle. The image feels like it’s been created by a professional.
Model ini menghasilkan imej lucu burung yang menunggang basikal. Imej itu kelihatan seperti ia ditarik oleh seorang lelaki berusia 5 tahun.
Model ini menghasilkan imej yang berwarna -warni dan bersemangat dari pelikan yang menunggang basikal. Imej itu terasa seperti ia telah dicipta oleh seorang profesional.
Analisis perbandingan
keputusan akhir: Grok 3: 2 | O3-Mini: 2
Ringkasan Perbandingan
Task
Task
Grok 3
o3-mini
Reasoning
✅
❌
Coding
✅
❌
Search
❌
✅
Image Generation
❌
✅
grok 3 penaakulan ✅ ❌ C. Oding ✅ ❌ Generasi carian ❌ ✅ ❌ ✅
grok 3 vs o3-mini: perbandingan penanda aras
bar tambahan di atas model Grok 3 mungkin mewakili peningkatan prestasi apabila menggunakan pemikiran rantaian pemikiran (COT) atau masa kesimpulan yang dilanjutkan.
Tetapi apa yang belum dapat dilihat adalah bagaimana seluruh model akan dilakukan diberikan masa pengiraan tambahan seperti yang diberikan kepada model Grok 3. Hanya sekali percubaan yang telah dijalankan, boleh ada perbandingan yang adil antara model.
Kedua-dua Grok 3 dan O3-Mini adalah model yang agak kuat. Inilah yang ditawarkan oleh masing -masing dari segi ciri dan aplikasi: x.ai vs openai: perbandingan keseluruhan
Ia adalah tali leher untuk sekarang! Dengan Grok 3, Elon Musk menjanjikan penambahbaikan yang berlaku setiap hari. Sementara itu, Sam Altman telah menjanjikan GPT-5, yang jika khabar angin harus dipercayai, membawa kita lebih dekat ke AGI berbanding sebelum ini. Dalam perlumbaan ini menjadi LLM teratas, satu perkara yang pasti, dengan setiap model yang akan datang kita melihat peningkatan yang dapat merevolusikan cara kita bekerja, hidup, dan berfikir.
Walau bagaimanapun, satu perkataan yang berhati -hati mesti dilaksanakan oleh kedua -dua syarikat yang melancarkan LLM ini mengenai penggunaan sumber. Ketika datang ke kesan alam sekitar, model maju ini memerlukan sejumlah besar tenaga dan penyejuk untuk menguasai pusat data yang menjalankannya. Ini adalah kebimbangan utama apabila syarikat -syarikat berjalan ke arah mencapai tempat teratas dalam perlumbaan LLM.
a. Grok 3 adalah model AI terkini X.AI, yang direka untuk bersaing dengan Openai's O3-Mini, GPT-4, dan DeepSeek-V3. Ia mempunyai penalaran maju, carian mendalam, dan keupayaan berfikir yang lebih panjang. Q2. Yang lebih baik: grok 3 atau o3-mini? Q6. Adakah Grok 3 mempunyai API? a. Belum lagi, tetapi X.AI telah mengesahkan API akan datang tidak lama lagi. Q7. Apakah perbezaan antara Grok 3 dan Grok 3 mini? Q9. Apakah ciri 'otak besar' dalam grok 3? a. Carian Deep mengambil semula maklumat berasaskan web secara nyata dengan petikan, sama dengan penyelidikan yang mendalam Openai tetapi direka untuk pandangan yang lebih terperinci.
https://cdn.analyticsvidhya.com/wp-content/uploads/2025/02/screen-recording-2025-02-18-101821-online-video-cutter.com_.mp4 Muat turun
Atas ialah kandungan terperinci Grok 3 vs O3-Mini: Model mana yang lebih baik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!