Grok 3 vs Deepseek R1: Mana yang lebih baik?-AI-php.cn

Grok 3 vs Deepseek R1: Mana yang lebih baik?

Lisa Kudrow

Lepaskan： 2025-03-04 09:51:11

asal

177 orang telah melayarinya

beberapa bulan yang lalu, model Deepseek's V3, R1, dan Janus membuat gelombang dalam komuniti AI. Kini, Elon Musk's Grok 3 telah memasuki arena, memaparkan gelaran "Smartest AI di Bumi." Penanda aras awal dari XAI mengagumkan, menunjukkan Grok 3 melampaui pesaing dalam pelbagai ujian. Tetapi bagaimana ia melaksanakan tugas sehari -hari? Adakah langganan premium $ 40 x berbaloi? Artikel ini membandingkan Grok 3 dan DeepSeek R1 merentasi lima arahan yang pelbagai untuk mengetahui.

Grok 3 vs DeepSeek R1: Which is Better?

Jadual Kandungan:

Tugas 1: Generasi Kod Python

prompt: "Tulis fungsi python untuk menghasilkan maze rawak menggunakan carian mendalam-pertama dan gambarkannya menggunakan matplotlib."

~~(lihat perbandingan kod dan imej dalam teks asal. Mengekalkan pemformatan dan imej asal.)~~

Pemerhatian:

DeepSeek R1 menghasilkan maze yang jelas dan berstruktur. Output Grok 3 adalah pixelated dan kurang ditakrifkan, walaupun menggunakan DFS.

keputusan:

grok 3 ❌ deepseek r1 ✅

tugas 2: carian web

(Nota: DeepSeek R1 menggunakan fungsi cariannya sendiri untuk tugas ini.)

prompt:

"Apakah kemajuan terkini dalam teknologi gabungan nuklear pada tahun 2025? Format: Senarai sumber kemajuan."

(Mengekalkan video asal embed.)

Pemerhatian:

DeepSeek R1 menyediakan sumber yang dapat disahkan untuk setiap tuntutan, yang menawarkan respons yang lebih komprehensif dan boleh dipercayai. Grok 3 tidak mempunyai pautan sumber langsung, bergantung kepada sumber yang kurang dipercayai seperti X (dahulunya Twitter).

keputusan:

grok 3 ❌ deepseek r1 ✅

Tugas 3: Animasi HTML Asas

prompt:

"Buat kod CSS HTML untuk bola merah berputar secara berterusan di dalam persegi."

(Mengekalkan coretan kod asal dan embed video.)

Pemerhatian:

Grok 3 berjuang untuk menghasilkan kod yang betul. DeepSeek R1, sementara lebih perlahan, menyediakan kod yang tepat dan berfungsi.

keputusan:

grok 3 ❌ deepseek r1 ✅

tugas 4: analisis imej (catur)

prompt:

"Menganalisis kedudukan papan catur ini. Cadangkan langkah terbaik untuk White untuk memeriksa hitam dan jelaskan alasannya."

(mengekalkan perbandingan imej asal.)

pemerhatian:

kedua -dua model gagal mengenal pasti dengan betul.

keputusan:

grok 3 ❌ deepseek r1 ❌

tugas 5: penalaran logik (teka -teki zebra)

prompt: "Selesaikan teka -teki zebra ini. Berikan saya output dalam jadual."

(mengekalkan perbandingan imej asal.)

pemerhatian: DeepSeek R1 dengan betul menyelesaikan teka -teki; Grok 3 tidak.

keputusan: grok 3 ❌ deepseek r1 ✅

grok 3 vs deepseek r1: hasil

(Mengekalkan jadual asal.)

Kesimpulan

tuntutan pemasaran Grok 3 sebagai "AI yang paling bijak" tidak disokong oleh ujian dunia sebenar ini. DeepSeek R1 secara konsisten mengatasi grok 3 dalam ketepatan, struktur, dan verifiability. Walaupun Grok 3 menunjukkan potensi di beberapa kawasan, kelemahannya dalam penalaran logik dan penyelesaian masalah yang kompleks adalah penting. Sama ada kemas kini masa depan akan meningkatkan Grok 3 masih dapat dilihat. Hasilnya mencadangkan XAI memerlukan penambahbaikan yang besar terhadap kaedah latihannya.

(mengekalkan panggilan asal untuk tindakan dan pautan blog.)

Atas ialah kandungan terperinci Grok 3 vs Deepseek R1: Mana yang lebih baik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!