Dieses Jahr war voller aufregender Veröffentlichungen im Genai -Raum, von Claude Sonnet 3.5 über Openai's O1 bis hin zu Metas Lama 3.3 und vielem mehr. Bei so viel Ereignis ist es ziemlich schwierig, ein Modell auszuwählen, das keine bessere Alternative hat. Die jüngste Einführung von Deepseek V3 hat die Genai-Welt mit ihren beeindruckenden Fähigkeiten erschüttert und soll das beste Open-Source-Modell sein, das heute verfügbar ist. Also beschloss ich, es gegen Claude 3.5 Sonett zu testen. In diesem Artikel werde ich diese Modelle mit den gleichen Aufforderungen testen, um zu sehen, welche eine bessere Antwort bietet! Beginnen wir also unseren Deepseek V3 gegen Claude Sonnet 3.5 Battle!
Eingabeaufforderung: Sie sind in Eile zur Arbeit. Sie gießen sich eine Tasse schwarzer Kaffee, aber es ist zu heiß. Sie beabsichtigen, eine feste Menge kalter Milch hinzuzufügen, aber Sie wissen, dass der Kaffee auch danach einige Minuten abkühlen muss, bevor Sie ihn trinken können.
In diesem Fall kühlt der Kaffee mehr ab:
1) Milch sofort hinzufügen und dann einige Minuten vor dem Trinken warten.
2) Warten Sie ein paar Minuten und fügen Sie dann kurz vor dem Trinken Milch hinzu.
Deepseek v3:
Claude Sonett 3.5:
Beobachtung:
Deepseek V3 schlägt sofort vor, dass die Temperatur des Kaffees sofort kaltes Milch hinzufügt und dann weiter abkühlt. Im Gegensatz dazu sagt Claude Sonnet 3.5, dass es besser ist, den schwarzen Kaffee zuerst abkühlen zu lassen - weil eine heißere Flüssigkeit schneller die Hitze verliert -, dann milch, bevor sie für einen zusätzlichen Temperaturabfall trinken. Die meisten physikbasierten Erklärungen bevorzugen Claude Sonnet 3.5. Wenn der Kaffee anfänglich heißer bleibt, verliert er aufgrund der größeren Temperaturdifferenz mit der Umgebung mehr Wärme durch eine schnellere Kühlung. Das Hinzufügen von Milch am Ende bietet dann eine endgültige Abkühlung, was zu einer niedrigeren Gesamttemperatur zum Trinkzeit führt.
Urteil:
Deepseek v3 ❌ | Claude Sonett 3.5 ✅
PORMPT: Erstellen Sie ein logisches Flussdiagramm für das Entwurfsmuster mit mehreren Agenten. Es handelt sich um die folgenden Schritte:
1. Brechen Sie die Aufgabe: Definieren Sie das Gesamtziel und teilen Sie es in kleinere Unteraufgaben auf, um zu ermitteln, wie sie voneinander abhängen.
2. Rollen zuweisen: Weisen Sie jede Subtask dem am besten geeigneten Agenten zu, wodurch Verantwortlichkeiten und Leistungen beschrieben werden. 3. Plankommunikation: Entscheiden Sie, ob Agenten direkt oder über einen Vorgesetzten mit konsistenten Formaten kommunizieren.
4. Ausführen: Ausführen von Agenten parallel oder sequenz, verfolgen Sie ihre Ausgänge für Vollständigkeit und Genauigkeit.
5. Validieren und integrieren: Kombinieren Sie alle Agentenergebnisse in einer endgültigen Antwort und prüfen Sie auf Fehler oder Inkonsistenzen.
6. Verfeinerung: Sammeln Sie Feedback, um die Rollen oder Prozesse zu verbessern und Anweisungen oder Workflows bei Bedarf zu aktualisieren.
Deepseek V3 Ausgang:
-----------------------------------------<br> | Start |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 1. Brechen Sie die Aufgabe |<br> | - Definieren Sie das Gesamtziel |<br> | - Teilen Sie das Ziel in kleinere Unteraufgaben |<br> | - Identifizieren Sie Abhängigkeiten zwischen Unteraufgaben |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 2. Rollen zuweisen |<br> | - Weisen Sie jede Subtask dem am besten geeigneten | zu<br> | Agent |<br> | - Übersicht der Verantwortlichkeiten und Leistungen |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 3. Plankommunikation |<br> | - Entscheiden Sie, ob Agenten direkt kommunizieren |<br> | oder durch einen Vorgesetzten |<br> | - Verwenden Sie konsistente Kommunikationsformate |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 4. Ausführen |<br> | - Run Agenten parallel oder sequenz |<br> | - Ausgänge für Vollständigkeit & |<br> | Genauigkeit |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 5. Validieren und integrieren |<br> | - Kombinieren Sie alle Agentenergebnisse zu einem |<br> | endgültige Antwort |<br> | - Überprüfen Sie, ob Fehler oder Inkonsistenzen |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 6. Refine |<br> | - Feedback sammeln, um die Rollen zu verbessern oder |<br> | Prozesse |<br> | - Aktualisieren Sie Anweisungen oder Workflows als |<br> | benötigt |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | Ende |<br> -----------------------------------------
Claude Sonnet 3.5 Ausgabe:
Beobachtung:
Claude Sonnet 3.5 ist besser, da es Entscheidungspunkte und Feedback -Schleifen zeigt. Multi-Agent-Systeme müssen häufig erneut Schritte eintauchen und verfeinern. Wenn Sie nur eine einfache Liste benötigen, kann Deepseek V3 ausreichen. Für echte Workflows, die iterative Verbesserungen und Verzweigungen erfordern, bietet Claude Sonnet 3.5 eine klarere, vollständigere Struktur.
Urteil:
Deepseek v3 ❌ | Claude Sonett 3.5 ✅
Eingabeaufforderung: Analysieren Sie den folgenden Inhalt und listen Sie die Anzahl der grammatikalischen Fehler im Text auf.
Trotz der kurzlebigen Natur der Existenz bleiben viele unangebracht in ihren Illusionen. Ungläubig unterstreicht kurzlebige Verschiebungen der kosmischen Nuance die labyrinthische Komplexität, die sich selbst mit den am meisten gelehrten Köpfen konfrontiert. Bis wir unsere kollektiven Energien zusammenfassen, um diese belastenden Feinheiten zu überwinden, muss die Menschheit von Verwirrungen über gemessene Verwirrungen begeistert bleiben. Doch sind wir wirklich prädestiniert, in existenziellen Feuchten zu bleiben? Als anthromorphe Spezies ist unsere größte Torheit vielleicht hubristische Selbstzufriedenheit und manifestiert sich, wenn Klarheit winkt. Die Verantwortung beruht auf Selbstbeobachtung für die Anerkennung immaterieller Zwänge fördert die Befreiung. Der Vorsitz von Wissen spreigt uns weiter und schlägt einen unsicheren, aber unverzichtbaren Weg. Achten Sie auf.
Deepseek V3 Ausgang:
Hier ist eine Liste von Fehlern im Absatz:
Liste der Fehler:
["Existance", "Unterstriche", "bis", "prädestiniert", "anthromorph", "Selbstzufriedenheit", "Vorbereitungen"]Claude Sonnet 3.5 Ausgabe:
Hier sind alle Fehler im Absatz, die in der Reihenfolge des Erscheinens aufgeführt sind:
Der Absatz enthält 8 unterschiedliche Fehler, die hauptsächlich aus Rechtschreibfehlern, Fragen der Subjekt-Verb-Vereinbarung und Interpunktionsfehlern bestehen.
Beobachtung:
Die Reaktion von Claude Sonnet 3.5 ist besser, da es mehr Probleme auffängt. Es weist nicht nur auf Rechtschreib- und Subjektversorgungsfehler wie Deepseek V3 hin, sondern stellt auch ein fehlendes Fragezeichen fest und schlägt eine stilistische Verbesserung für „Take Take“ vor. Diese breitere Abdeckung macht es insgesamt zu einer gründlicheren Analyse.
Urteil:
Deepseek v3 ❌ | Claude Sonett 3.5 ✅
Eingabeaufforderung: Wie hoch ist die Gewinnwahrscheinlichkeit für jedes Team in diesem Spiel?
Deepseek V3 Ausgang:
Claude Sonnet 3.5 Ausgabe:
Beobachtung:
Claude Sonnet 3.5 bietet eine genauere, kontextbezogene Lektüre der Anzeigetafel und führt die Chase -Anforderungen aus, was zu einer realistischeren Wahrscheinlichkeitsschätzung führt. Es faktor, in der verbleibenden Overs und der erforderlichen Laufrate. Deepseek V3 interpretiert die Match -Situation falsch, daher ist seine Schlussfolgerung weniger zuverlässig. Infolgedessen ist die Antwort von Claude Sonnet 3.5 besser , da es mit den richtigen Übereinstimmungsdetails und der Standard -Cricket -Chase -Logik übereinstimmt.
Urteil:
Deepseek v3 ❌ | Claude Sonett 3.5 ✅
Eingabeaufforderung: Eine schwerelose Saite verbindet zwei identische Metallkugeln. Die Mitte der Saite befindet sich über dem Rand einer Tabelle. Sie lassen beide Bälle gleichzeitig los. Was wird früher passieren: Ball 1 fliegt vom Tisch oder Ball 2 und schlägt seine Seite?
Deepseek V3 Ausgang:
Verstehe das Setup
Kräfte, die auf die Bälle wirken
Was passiert früher?
Claude Sonnet 3.5 Ausgabe:
Erstes Setup
Wenn Bälle freigelassen werden
Die Physik
Das Ergebnis
Obervation:
Claude Sonnet 3.5 ist korrekter. Unter idealen (reibungslosen) Bedingungen bewegt sich jede Kugel mit der gleichen horizontalen Beschleunigung den gleichen horizontalen Abstand, so dass Ball 1 genau abfliegt, wenn Ball 2 die Seite trifft. Deepseek V3 priorisiert fälschlicherweise den Abzug der Schwerkraft am Ball 2, aber der Schlüsselfaktor ist der horizontale Zug aus der Schnur, die für beide Kugeln symmetrisch ist. Infolgedessen erreichen sie gleichzeitig die Kante/Seite der Tabelle in einem reinen Physik-Szenario.
Urteil:
Deepseek v3 ❌ | Claude Sonett 3.5 ✅
Aufgabe | Gewinner |
---|---|
Aufgabe 1: Lösen Sie ein Puzzle | Claude Sonett 3.5 |
Aufgabe 2: Erstellen Sie ein Flussdiagramm | Claude Sonett 3.5 |
Aufgabe 3: Grammatikfehler finden | Claude Sonett 3.5 |
Aufgabe 4: Berechnen Sie die Gewinnwahrscheinlichkeit | Claude Sonett 3.5 |
Aufgabe 5: Physikproblem | Claude Sonett 3.5 |
Lesen Sie auch:
Die Aufgaben in diesem Artikel bieten einen Einblick in die Fähigkeiten von Deepseek v3 gegen Claude 3.5 Sonett, aber sie sind nur ein kleiner Teil dieser Modelle. Vermeiden Sie es, sie ausschließlich auf der Grundlage dieser Ergebnisse zu beurteilen. Erforschen und verwenden Sie jedes Modell nach Ihren spezifischen Anforderungen und Anforderungen.
Haben Sie Deepseek V3 oder Claude 3.5 Sonett ausprobiert? Teilen Sie Ihre Erfahrungen und Erkenntnisse in den Kommentaren unten mit!
Erfahren Sie, wie Sie Deepseek mit unserem Kurs „Anfangen mit Deepseek“ verwenden! Verstehen Sie seine Funktionen, vergleichen Sie es mit anderen KI -Modellen und gewinnen Sie praktische Erkenntnisse, um schnell loszulegen.
Das obige ist der detaillierte Inhalt vonDeepseek V3 gegen Claude Sonnet 3.5: Was ist besser?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!