Rumah > Peranti teknologi > AI > Grok 3 vs Deepseek R1: Mana yang lebih baik?

Grok 3 vs Deepseek R1: Mana yang lebih baik?

Lisa Kudrow
Lepaskan: 2025-03-04 09:51:11
asal
177 orang telah melayarinya

beberapa bulan yang lalu, model Deepseek's V3, R1, dan Janus membuat gelombang dalam komuniti AI. Kini, Elon Musk's Grok 3 telah memasuki arena, memaparkan gelaran "Smartest AI di Bumi." Penanda aras awal dari XAI mengagumkan, menunjukkan Grok 3 melampaui pesaing dalam pelbagai ujian. Tetapi bagaimana ia melaksanakan tugas sehari -hari? Adakah langganan premium $ 40 x berbaloi? Artikel ini membandingkan Grok 3 dan DeepSeek R1 merentasi lima arahan yang pelbagai untuk mengetahui.

Grok 3 vs DeepSeek R1: Which is Better?

Jadual Kandungan:

    Tugas 1: Generasi Kod Python
  • tugas 2: carian web
  • Tugas 3: Animasi HTML Asas
  • Tugas 4: Analisis Imej (Catur)
  • Tugas 5: Penalaran Logik (teka -teki zebra)
  • Grok 3 vs DeepSeek R1: Hasil
  • Kesimpulan

Tugas 1: Generasi Kod Python

prompt: "Tulis fungsi python untuk menghasilkan maze rawak menggunakan carian mendalam-pertama dan gambarkannya menggunakan matplotlib."

(lihat perbandingan kod dan imej dalam teks asal. Mengekalkan pemformatan dan imej asal.)

Pemerhatian:

DeepSeek R1 menghasilkan maze yang jelas dan berstruktur. Output Grok 3 adalah pixelated dan kurang ditakrifkan, walaupun menggunakan DFS.

keputusan:

grok 3 ❌ deepseek r1 ✅

tugas 2: carian web

(Nota: DeepSeek R1 menggunakan fungsi cariannya sendiri untuk tugas ini.)

prompt:

"Apakah kemajuan terkini dalam teknologi gabungan nuklear pada tahun 2025? Format: Senarai sumber kemajuan."

(Mengekalkan video asal embed.)

Pemerhatian:

DeepSeek R1 menyediakan sumber yang dapat disahkan untuk setiap tuntutan, yang menawarkan respons yang lebih komprehensif dan boleh dipercayai. Grok 3 tidak mempunyai pautan sumber langsung, bergantung kepada sumber yang kurang dipercayai seperti X (dahulunya Twitter).

keputusan:

grok 3 ❌ deepseek r1 ✅

Tugas 3: Animasi HTML Asas

prompt:

"Buat kod CSS HTML untuk bola merah berputar secara berterusan di dalam persegi."

(Mengekalkan coretan kod asal dan embed video.)

Pemerhatian:

Grok 3 berjuang untuk menghasilkan kod yang betul. DeepSeek R1, sementara lebih perlahan, menyediakan kod yang tepat dan berfungsi.

keputusan:

grok 3 ❌ deepseek r1 ✅

tugas 4: analisis imej (catur)

prompt:

"Menganalisis kedudukan papan catur ini. Cadangkan langkah terbaik untuk White untuk memeriksa hitam dan jelaskan alasannya."

(mengekalkan perbandingan imej asal.)

pemerhatian:

kedua -dua model gagal mengenal pasti dengan betul.

keputusan:

grok 3 ❌ deepseek r1 ❌

tugas 5: penalaran logik (teka -teki zebra)

prompt: "Selesaikan teka -teki zebra ini. Berikan saya output dalam jadual."

(mengekalkan perbandingan imej asal.)

pemerhatian: DeepSeek R1 dengan betul menyelesaikan teka -teki; Grok 3 tidak.

keputusan: grok 3 ❌ deepseek r1 ✅

grok 3 vs deepseek r1: hasil

(Mengekalkan jadual asal.)

Kesimpulan

tuntutan pemasaran Grok 3 sebagai "AI yang paling bijak" tidak disokong oleh ujian dunia sebenar ini. DeepSeek R1 secara konsisten mengatasi grok 3 dalam ketepatan, struktur, dan verifiability. Walaupun Grok 3 menunjukkan potensi di beberapa kawasan, kelemahannya dalam penalaran logik dan penyelesaian masalah yang kompleks adalah penting. Sama ada kemas kini masa depan akan meningkatkan Grok 3 masih dapat dilihat. Hasilnya mencadangkan XAI memerlukan penambahbaikan yang besar terhadap kaedah latihannya.

(mengekalkan panggilan asal untuk tindakan dan pautan blog.)

Atas ialah kandungan terperinci Grok 3 vs Deepseek R1: Mana yang lebih baik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan