Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?-KI-php.cn

Dieses Jahr war voller aufregender Veröffentlichungen im Genai -Raum, von Claude Sonnet 3.5 über Openai's O1 bis hin zu Metas Lama 3.3 und vielem mehr. Bei so viel Ereignis ist es ziemlich schwierig, ein Modell auszuwählen, das keine bessere Alternative hat. Die jüngste Einführung von Deepseek V3 hat die Genai-Welt mit ihren beeindruckenden Fähigkeiten erschüttert und soll das beste Open-Source-Modell sein, das heute verfügbar ist. Also beschloss ich, es gegen Claude 3.5 Sonett zu testen. In diesem Artikel werde ich diese Modelle mit den gleichen Aufforderungen testen, um zu sehen, welche eine bessere Antwort bietet! Beginnen wir also unseren Deepseek V3 gegen Claude Sonnet 3.5 Battle!

Inhaltsverzeichnis

Aufgabe 1: Lösen Sie ein Puzzle
Aufgabe 2: Erstellen Sie ein Flussdiagramm
Aufgabe 3: Grammatikfehler finden
Aufgabe 4: Berechnen Sie das Gewinnwahrscheinlichkeit
Aufgabe 5: Physikproblem
Endergebnis: Deepseek V3 gegen Claude Sonett 3.5
Endnote

Aufgabe 1: Lösen Sie ein Puzzle

Eingabeaufforderung: Sie sind in Eile zur Arbeit. Sie gießen sich eine Tasse schwarzer Kaffee, aber es ist zu heiß. Sie beabsichtigen, eine feste Menge kalter Milch hinzuzufügen, aber Sie wissen, dass der Kaffee auch danach einige Minuten abkühlen muss, bevor Sie ihn trinken können.
In diesem Fall kühlt der Kaffee mehr ab:
1) Milch sofort hinzufügen und dann einige Minuten vor dem Trinken warten.
2) Warten Sie ein paar Minuten und fügen Sie dann kurz vor dem Trinken Milch hinzu.

Deepseek v3:

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Claude Sonett 3.5:

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Beobachtung:

Deepseek V3 schlägt sofort vor, dass die Temperatur des Kaffees sofort kaltes Milch hinzufügt und dann weiter abkühlt. Im Gegensatz dazu sagt Claude Sonnet 3.5, dass es besser ist, den schwarzen Kaffee zuerst abkühlen zu lassen - weil eine heißere Flüssigkeit schneller die Hitze verliert -, dann milch, bevor sie für einen zusätzlichen Temperaturabfall trinken. Die meisten physikbasierten Erklärungen bevorzugen Claude Sonnet 3.5. Wenn der Kaffee anfänglich heißer bleibt, verliert er aufgrund der größeren Temperaturdifferenz mit der Umgebung mehr Wärme durch eine schnellere Kühlung. Das Hinzufügen von Milch am Ende bietet dann eine endgültige Abkühlung, was zu einer niedrigeren Gesamttemperatur zum Trinkzeit führt.

Urteil:

Deepseek v3 ❌ | Claude Sonett 3.5 ✅

Aufgabe 2: Erstellen Sie ein Flussdiagramm

PORMPT: Erstellen Sie ein logisches Flussdiagramm für das Entwurfsmuster mit mehreren Agenten. Es handelt sich um die folgenden Schritte:
1. Brechen Sie die Aufgabe: Definieren Sie das Gesamtziel und teilen Sie es in kleinere Unteraufgaben auf, um zu ermitteln, wie sie voneinander abhängen.
2. Rollen zuweisen: Weisen Sie jede Subtask dem am besten geeigneten Agenten zu, wodurch Verantwortlichkeiten und Leistungen beschrieben werden. 3. Plankommunikation: Entscheiden Sie, ob Agenten direkt oder über einen Vorgesetzten mit konsistenten Formaten kommunizieren.
4. Ausführen: Ausführen von Agenten parallel oder sequenz, verfolgen Sie ihre Ausgänge für Vollständigkeit und Genauigkeit.
5. Validieren und integrieren: Kombinieren Sie alle Agentenergebnisse in einer endgültigen Antwort und prüfen Sie auf Fehler oder Inkonsistenzen.
6. Verfeinerung: Sammeln Sie Feedback, um die Rollen oder Prozesse zu verbessern und Anweisungen oder Workflows bei Bedarf zu aktualisieren.

Deepseek V3 Ausgang:

 -----------------------------------------<br> | Start |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 1. Brechen Sie die Aufgabe |<br> | - Definieren Sie das Gesamtziel |<br> | - Teilen Sie das Ziel in kleinere Unteraufgaben |<br> | - Identifizieren Sie Abhängigkeiten zwischen Unteraufgaben |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 2. Rollen zuweisen |<br> | - Weisen Sie jede Subtask dem am besten geeigneten | zu<br> | Agent |<br> | - Übersicht der Verantwortlichkeiten und Leistungen |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 3. Plankommunikation |<br> | - Entscheiden Sie, ob Agenten direkt kommunizieren |<br> | oder durch einen Vorgesetzten |<br> | - Verwenden Sie konsistente Kommunikationsformate |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 4. Ausführen |<br> | - Run Agenten parallel oder sequenz |<br> | - Ausgänge für Vollständigkeit & |<br> | Genauigkeit |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 5. Validieren und integrieren |<br> | - Kombinieren Sie alle Agentenergebnisse zu einem |<br> | endgültige Antwort |<br> | - Überprüfen Sie, ob Fehler oder Inkonsistenzen |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | 6. Refine |<br> | - Feedback sammeln, um die Rollen zu verbessern oder |<br> | Prozesse |<br> | - Aktualisieren Sie Anweisungen oder Workflows als |<br> | benötigt |<br> -----------------------------------------<br> |<br> v<br> -----------------------------------------<br> | Ende |<br> -----------------------------------------

Nach dem Login kopieren

Claude Sonnet 3.5 Ausgabe:

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Beobachtung:

Claude Sonnet 3.5 ist besser, da es Entscheidungspunkte und Feedback -Schleifen zeigt. Multi-Agent-Systeme müssen häufig erneut Schritte eintauchen und verfeinern. Wenn Sie nur eine einfache Liste benötigen, kann Deepseek V3 ausreichen. Für echte Workflows, die iterative Verbesserungen und Verzweigungen erfordern, bietet Claude Sonnet 3.5 eine klarere, vollständigere Struktur.

Urteil:

Deepseek v3 ❌ | Claude Sonett 3.5 ✅

Aufgabe 3: Grammatikfehler finden

Eingabeaufforderung: Analysieren Sie den folgenden Inhalt und listen Sie die Anzahl der grammatikalischen Fehler im Text auf.
Trotz der kurzlebigen Natur der Existenz bleiben viele unangebracht in ihren Illusionen. Ungläubig unterstreicht kurzlebige Verschiebungen der kosmischen Nuance die labyrinthische Komplexität, die sich selbst mit den am meisten gelehrten Köpfen konfrontiert. Bis wir unsere kollektiven Energien zusammenfassen, um diese belastenden Feinheiten zu überwinden, muss die Menschheit von Verwirrungen über gemessene Verwirrungen begeistert bleiben. Doch sind wir wirklich prädestiniert, in existenziellen Feuchten zu bleiben? Als anthromorphe Spezies ist unsere größte Torheit vielleicht hubristische Selbstzufriedenheit und manifestiert sich, wenn Klarheit winkt. Die Verantwortung beruht auf Selbstbeobachtung für die Anerkennung immaterieller Zwänge fördert die Befreiung. Der Vorsitz von Wissen spreigt uns weiter und schlägt einen unsicheren, aber unverzichtbaren Weg. Achten Sie auf.

Deepseek V3 Ausgang:

Hier ist eine Liste von Fehlern im Absatz:

"Existance" - Falsche Schreibweise. Korrektur: "Existenz" .
"Unterstriche" -Fehlervereinbarungsfehler. Korrektur: "Unterstrich" .
"Bis" - falsche Schreibweise. Korrektur: „Bis“ .
"Prädestiniert" - Falsches Wortnutzung. Korrektur: „Prädestiniert“ .
"Anthromorph" - falsche Schreibweise. Korrektur: "Anthropomorph" .
"Selbstzufriedenheit" - Falsches Wortnutzung. Korrektur: „Selbstzufriedenheit“ .
"Presipice" - Falsche Schreibweise. Korrektur: „Abgrund“ .

Liste der Fehler:

["Existance", "Unterstriche", "bis", "prädestiniert", "anthromorph", "Selbstzufriedenheit", "Vorbereitungen"]

Claude Sonnet 3.5 Ausgabe:

Hier sind alle Fehler im Absatz, die in der Reihenfolge des Erscheinens aufgeführt sind:

"Existance" - Falsche Schreibweise (sollte "Existenz" sein)
"Unterstriche"-Versuchsvereinbarungsfehler (sollte "unterstreichen", da "Verschiebungen" plural ist)
"Bis" - falsche Schreibweise (sollte "bis" sein)
"Prädestiniert" - Falsches Wortform (sollte "vorherbestimmt" sein)
"Existenzielle Feuchten" - Fehlende Fragezeichen am Ende des Satzes
"Anthromorph" - falsche Schreibweise (sollte "anthropomorph" sein)
"Presipice" - Falsche Schreibweise (sollte "Abgrund" sein)
Stylistisch ist der Zeitraum nach „Take Treat“ unnötig, da es sich um ein Befehl/einen Imperativ handelt

Der Absatz enthält 8 unterschiedliche Fehler, die hauptsächlich aus Rechtschreibfehlern, Fragen der Subjekt-Verb-Vereinbarung und Interpunktionsfehlern bestehen.

Beobachtung:

Die Reaktion von Claude Sonnet 3.5 ist besser, da es mehr Probleme auffängt. Es weist nicht nur auf Rechtschreib- und Subjektversorgungsfehler wie Deepseek V3 hin, sondern stellt auch ein fehlendes Fragezeichen fest und schlägt eine stilistische Verbesserung für „Take Take“ vor. Diese breitere Abdeckung macht es insgesamt zu einer gründlicheren Analyse.

Urteil:

Deepseek v3 ❌ | Claude Sonett 3.5 ✅

Aufgabe 4: Berechnen Sie das Gewinnwahrscheinlichkeit

Eingabeaufforderung: Wie hoch ist die Gewinnwahrscheinlichkeit für jedes Team in diesem Spiel?

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Deepseek V3 Ausgang:

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Claude Sonnet 3.5 Ausgabe:

Deepseek V3 gegen Claude Sonnet 3.5: Was ist besser?

Beobachtung:

Claude Sonnet 3.5 bietet eine genauere, kontextbezogene Lektüre der Anzeigetafel und führt die Chase -Anforderungen aus, was zu einer realistischeren Wahrscheinlichkeitsschätzung führt. Es faktor, in der verbleibenden Overs und der erforderlichen Laufrate. Deepseek V3 interpretiert die Match -Situation falsch, daher ist seine Schlussfolgerung weniger zuverlässig. Infolgedessen ist die Antwort von Claude Sonnet 3.5 besser , da es mit den richtigen Übereinstimmungsdetails und der Standard -Cricket -Chase -Logik übereinstimmt.

Urteil:

Deepseek v3 ❌ | Claude Sonett 3.5 ✅

Aufgabe 5: Physikproblem

Eingabeaufforderung: Eine schwerelose Saite verbindet zwei identische Metallkugeln. Die Mitte der Saite befindet sich über dem Rand einer Tabelle. Sie lassen beide Bälle gleichzeitig los. Was wird früher passieren: Ball 1 fliegt vom Tisch oder Ball 2 und schlägt seine Seite?

Deepseek V3 Ausgang:

Verstehe das Setup

Zwei identische Metallkugeln sind durch eine Schnur verbunden.
Die Schnur ist so platziert, dass sich eine Kugel auf dem Tisch befindet (Ball 1) und der andere am Tisch hängt (Ball 2).
Beide Bälle werden gleichzeitig freigegeben.

Kräfte, die auf die Bälle wirken

Ball 1 (auf dem Tisch) :
- Horizontal zum Rand des Tisches durch die Schnur gezogen.
Ball 2 (am Tisch hängen) :
- Durch Schwerkraft nach unten gezogen und durch die Schnur leicht nach oben nach oben.

Was passiert früher?

Die Schwerkraft (Ziehung 2 nach unten) ist eine stärkere Kraft als der horizontale Zug am Ball 1.
Daher trifft Ball 2 früher auf die Seite des Tisches, als Ball 1 vom Tisch fliegt.

Endgültige Antwort: Ball 2, der auf die Seite des Tisches traf, wird früher stattfinden.

Claude Sonnet 3.5 Ausgabe:

Erstes Setup

Zwei identische Metallkugeln, die von einer schwerlosen Schnur verbunden sind
Der Mittelpunkt der String befindet sich über der Tischkante
Ball 1 ist auf dem Tisch, Ball 2 hängt von der Kante ab

Wenn Bälle freigelassen werden

Ball 2 fällt herunter
Ball 1 beginnt sich in Richtung Rand zu bewegen
Die Zeichenfolge verbindet ihre Bewegung

Die Physik

Der Abwärtszug von Ball 2 ist gleichermaßen durch die Schnur gespalten
Beide Kugeln bewegen sich mit der Hälfte der Beschleunigung der Schwerkraft (G/2)
Beide Bälle reisen die gleiche Entfernung (die Hälfte der Saitenlänge)

Das Ergebnis

Seit beiden Bällen:
- Fahren Sie die gleiche Entfernung
- Bewegen Sie sich mit der gleichen Beschleunigung
- Gleichzeitig beginnen
Sie werden genau zur gleichen Zeit ihre Ziele erreichen

Endgültige Antwort: Ball 1 erreicht den Rand des Tisches im gleichen Moment, in dem Ball 2 auf die Seite des Tisches trifft.

Obervation:

Claude Sonnet 3.5 ist korrekter. Unter idealen (reibungslosen) Bedingungen bewegt sich jede Kugel mit der gleichen horizontalen Beschleunigung den gleichen horizontalen Abstand, so dass Ball 1 genau abfliegt, wenn Ball 2 die Seite trifft. Deepseek V3 priorisiert fälschlicherweise den Abzug der Schwerkraft am Ball 2, aber der Schlüsselfaktor ist der horizontale Zug aus der Schnur, die für beide Kugeln symmetrisch ist. Infolgedessen erreichen sie gleichzeitig die Kante/Seite der Tabelle in einem reinen Physik-Szenario.

Urteil:

Deepseek v3 ❌ | Claude Sonett 3.5 ✅

Endergebnis: Deepseek V3 gegen Claude Sonett 3.5

Aufgabe	Gewinner
Aufgabe 1: Lösen Sie ein Puzzle	Claude Sonett 3.5
Aufgabe 2: Erstellen Sie ein Flussdiagramm	Claude Sonett 3.5
Aufgabe 3: Grammatikfehler finden	Claude Sonett 3.5
Aufgabe 4: Berechnen Sie die Gewinnwahrscheinlichkeit	Claude Sonett 3.5
Aufgabe 5: Physikproblem	Claude Sonett 3.5

Lesen Sie auch:

Deepseek V3 VS GPT-4O: Kann Open-Source AI mit der Macht von GPT-4o konkurrieren?
O1 gegen O1 Pro: Lohnt es sich, 200 Dollar auszugeben?
Ist das neue O1-Modell besser als GPT-4O?

Endnote

Die Aufgaben in diesem Artikel bieten einen Einblick in die Fähigkeiten von Deepseek v3 gegen Claude 3.5 Sonett, aber sie sind nur ein kleiner Teil dieser Modelle. Vermeiden Sie es, sie ausschließlich auf der Grundlage dieser Ergebnisse zu beurteilen. Erforschen und verwenden Sie jedes Modell nach Ihren spezifischen Anforderungen und Anforderungen.

Haben Sie Deepseek V3 oder Claude 3.5 Sonett ausprobiert? Teilen Sie Ihre Erfahrungen und Erkenntnisse in den Kommentaren unten mit!

Erfahren Sie, wie Sie Deepseek mit unserem Kurs „Anfangen mit Deepseek“ verwenden! Verstehen Sie seine Funktionen, vergleichen Sie es mit anderen KI -Modellen und gewinnen Sie praktische Erkenntnisse, um schnell loszulegen.

Das obige ist der detaillierte Inhalt vonDeepseek V3 gegen Claude Sonnet 3.5: Was ist besser?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!