Vor wenigen Monaten machten Deepseeks Modelle von V3, R1 und Janus Wellen in der AI -Community. Jetzt ist Elon Musks Grok 3 in die Arena eingetreten und hat den Titel "Smartest AI der Erde". Die ersten Benchmarks von XAI waren beeindruckend und zeigten, dass Grok 3 in verschiedenen Tests übertroffen wurde. Aber wie funktioniert es bei alltäglichen Aufgaben? Lohnt sich das 40 $ x Premium -Abonnement? Dieser Artikel vergleicht GROK 3 und Deepseek R1 in fünf verschiedenen Aufforderungen, um herauszufinden.
Inhaltsverzeichnis:
Aufgabe 1: Python -Code -Erzeugung
Eingabeaufforderung: "Schreiben Sie eine Python-Funktion, um ein zufälliges Labyrinth mithilfe der Tiefen-First-Suche zu generieren und sie mit Matplotlib zu visualisieren."
(Siehe Code- und Bildvergleiche im Originaltext. Behalten Sie die ursprüngliche Formatierung und das Bild bei.)
Beobachtung: Deepseek R1 erzeugte ein klares, gut strukturiertes Labyrinth. Der Ausgang von GROK 3 war pixeliert und weniger definiert, trotz der Verwendung von DFS.
Urteil: grok 3 ❌ Deepseek r1 ✅
Aufgabe 2: Websuche
(Hinweis: Deepseek R1 verwendete eine eigene Suchfunktion für diese Aufgabe.)
Eingabeaufforderung: "Was sind die neuesten Fortschritte in der nuklearen Fusionstechnologie ab 2025? Format: Liste der Fortschritte Quelle."
(Original -Video einbetten.)
Beobachtung: Deepseek R1 lieferte überprüfbare Quellen für jede Behauptung und bietet eine umfassendere und vertrauenswürdigere Reaktion. GROK 3 fehlte direkte Quellenverbindungen, die sich auf weniger zuverlässige Quellen wie X (ehemals Twitter) stützten.
Urteil: grok 3 ❌ Deepseek r1 ✅
Aufgabe 3: Grundlegende HTML -Animation
Eingabeaufforderung: "Erstellen Sie den HTML -CSS -Code für einen roten Ball, der sich kontinuierlich in einem Quadrat dreht."
(Originalcode -Snippets und Video -Einbettung beibehalten.)
Beobachtung: grok 3 hatte Mühe, den richtigen Code zu generieren. Deepseek R1 lieferte zwar langsamer, bietet einen genauen und funktionalen Code.
Urteil: grok 3 ❌ Deepseek r1 ✅
Aufgabe 4: Bildanalyse (Schach)
Eingabeaufforderung: "Analysieren Sie diese Schachbrettposition. Schlagen Sie den besten Schritt für White zum Schachmattschwarz vor und erklären Sie die Argumentation."
(Originalbildvergleiche beibehalten.)
Beobachtung: Beide Modelle konnten den Checkmate nicht korrekt identifizieren.
Urteil: grok 3 ❌ Deepseek r1 ❌
Aufgabe 5: Logisches Denken (Zebra -Puzzle)
Eingabeaufforderung: "Lösen Sie dieses Zebra -Puzzle. Geben Sie mir die Ausgabe in einer Tabelle."
(Originalbildvergleiche beibehalten.)
Beobachtung: Deepseek R1 hat das Puzzle richtig gelöst; Grok 3 tat nicht.
Urteil: grok 3 ❌ Deepseek r1 ✅
grok 3 gegen Deepseek R1: Ergebnisse
(Original Tabelle beibehalten.)
Schlussfolgerung
Die Marketingansprüche vonGrok 3, die "intelligenteste KI" zu sein, wurden durch diese realen Tests nicht unterstützt. Deepseek R1 übertraf GROK 3 in Genauigkeit, Struktur und Überprüfbarkeit. Während GROK 3 in einigen Bereichen ein Potenzial zeigte, sind seine Schwächen im logischen Denken und in komplexer Problemlösung signifikant. Ob zukünftige Updates GROK 3 verbessern werden, bleibt abzuwarten. Die Ergebnisse legen nahe, dass XAI seine Trainingsmethoden erhebliche Verbesserungen benötigt.
(Originaler Aufruf zum Handeln und Blog -Links beibehalten.)
Das obige ist der detaillierte Inhalt vonGrok 3 gegen Deepseek R1: Was ist besser?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!