beberapa bulan yang lalu, model Deepseek's V3, R1, dan Janus membuat gelombang dalam komuniti AI. Kini, Elon Musk's Grok 3 telah memasuki arena, memaparkan gelaran "Smartest AI di Bumi." Penanda aras awal dari XAI mengagumkan, menunjukkan Grok 3 melampaui pesaing dalam pelbagai ujian. Tetapi bagaimana ia melaksanakan tugas sehari -hari? Adakah langganan premium $ 40 x berbaloi? Artikel ini membandingkan Grok 3 dan DeepSeek R1 merentasi lima arahan yang pelbagai untuk mengetahui.
Jadual Kandungan:
Tugas 1: Generasi Kod Python
prompt: "Tulis fungsi python untuk menghasilkan maze rawak menggunakan carian mendalam-pertama dan gambarkannya menggunakan matplotlib."
Pemerhatian:
DeepSeek R1 menghasilkan maze yang jelas dan berstruktur. Output Grok 3 adalah pixelated dan kurang ditakrifkan, walaupun menggunakan DFS.
keputusan:grok 3 ❌ deepseek r1 ✅
tugas 2: carian web(Nota: DeepSeek R1 menggunakan fungsi cariannya sendiri untuk tugas ini.)
prompt:
"Apakah kemajuan terkini dalam teknologi gabungan nuklear pada tahun 2025? Format: Senarai sumber kemajuan."
(Mengekalkan video asal embed.)Pemerhatian:
DeepSeek R1 menyediakan sumber yang dapat disahkan untuk setiap tuntutan, yang menawarkan respons yang lebih komprehensif dan boleh dipercayai. Grok 3 tidak mempunyai pautan sumber langsung, bergantung kepada sumber yang kurang dipercayai seperti X (dahulunya Twitter).
keputusan:grok 3 ❌ deepseek r1 ✅
Tugas 3: Animasi HTML Asasprompt:
"Buat kod CSS HTML untuk bola merah berputar secara berterusan di dalam persegi."
(Mengekalkan coretan kod asal dan embed video.)Pemerhatian:
Grok 3 berjuang untuk menghasilkan kod yang betul. DeepSeek R1, sementara lebih perlahan, menyediakan kod yang tepat dan berfungsi.
keputusan:grok 3 ❌ deepseek r1 ✅
tugas 4: analisis imej (catur)prompt:
"Menganalisis kedudukan papan catur ini. Cadangkan langkah terbaik untuk White untuk memeriksa hitam dan jelaskan alasannya."
(mengekalkan perbandingan imej asal.)pemerhatian:
kedua -dua model gagal mengenal pasti dengan betul.
keputusan: grok 3 ❌ deepseek r1 ❌ tugas 5: penalaran logik (teka -teki zebra) prompt: "Selesaikan teka -teki zebra ini. Berikan saya output dalam jadual." (mengekalkan perbandingan imej asal.) pemerhatian: DeepSeek R1 dengan betul menyelesaikan teka -teki; Grok 3 tidak. keputusan: grok 3 ❌ deepseek r1 ✅ grok 3 vs deepseek r1: hasil (Mengekalkan jadual asal.) Kesimpulan tuntutan pemasaran Grok 3 sebagai "AI yang paling bijak" tidak disokong oleh ujian dunia sebenar ini. DeepSeek R1 secara konsisten mengatasi grok 3 dalam ketepatan, struktur, dan verifiability. Walaupun Grok 3 menunjukkan potensi di beberapa kawasan, kelemahannya dalam penalaran logik dan penyelesaian masalah yang kompleks adalah penting. Sama ada kemas kini masa depan akan meningkatkan Grok 3 masih dapat dilihat. Hasilnya mencadangkan XAI memerlukan penambahbaikan yang besar terhadap kaedah latihannya. (mengekalkan panggilan asal untuk tindakan dan pautan blog.)
Atas ialah kandungan terperinci Grok 3 vs Deepseek R1: Mana yang lebih baik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!