Produziert von 51CTO Technology Stack (WeChat-ID: blog51cto)
Spät in der Nacht veröffentlichte OpenAIs stärkster Rivale Anthropic drei neue SOTA-Produkte auf einmal, darunter: Claude 3 Haiku, Claude 3 Sonnet und Claude 3 Opus. Die Branche rief aus: Claude 3 bringt eine Reihe neuer Branchenmaßstäbe.
Unter ihnen bedeutet Opus epische Bewegung, Sonnet bedeutet Sonett und Haiku bedeutet Haiku, ein dreizeiliges Kurzgedicht.
Es wird berichtet (Abbildung 9), dass Haiku das schnellste und kostengünstigste Modell auf dem KI-Markt ist. Es kann informative und datenintensive Forschungsarbeiten (~10.000 Token) auf arXiv, die Diagramme und Grafiken enthalten, in weniger als drei Sekunden lesen.
Abbildung 8: Sonnet ist bei den meisten Arbeitslasten doppelt so schnell wie Claude 2 und Claude 2.1 und verfügt über ein höheres Maß an Intelligenz. Es eignet sich hervorragend für Aufgaben, die schnelle Reaktionen erfordern, wie z. B. Wissensabruf oder Vertriebsautomatisierung. Opus ähnelt in der Geschwindigkeit Claude 2 und 2.1, verfügt jedoch über ein höheres Maß an Intelligenz.
Opus ist derzeit das intelligenteste Modell von Anthropic und übertrifft seine Mitbewerber bei den gängigsten Bewertungsbenchmarks für Systeme der künstlichen Intelligenz, darunter Undergraduate Level Expert Knowledge (MMLU), Graduate Level Expert Reasoning (GPQA), Basic Mathematics (GSM8K) usw. . Es demonstriert ein nahezu menschliches Verständnis und eine fließende Bewältigung komplexer Aufgaben und führt damit die Grenze der allgemeinen Intelligenz an.
Die oben genannten drei Claude-3-Modelle weisen alle größere Fähigkeiten bei der Analyse und Vorhersage, der Erstellung detaillierter Inhalte, der Codegenerierung und der Konversation in nicht-englischen Sprachen wie Spanisch, Japanisch und Französisch auf.
Darüber hinaus verfügt die Claude 3-Serie über nahezu perfekte Speicherkapazitäten und extrem lange Textfenster, die 200.000 Kontextfenster bereitstellen. Und es kann die Eingabe von mehr als 1 Million Token akzeptieren und wird nach und nach entsprechend den Kundenbedürfnissen freigegeben.
Insgesamt hat Claude3 drei schockierende Eigenschaften:
1. Benchmarks von Domain-Experten. Als Testmaßstäbe wurden drei Expertenbereiche aus den Bereichen Finanzen/Medizin/Philosophie ausgewählt. Jim Fan, Forschungsleiter bei NVIDIA, sagte: „Es wird empfohlen, dass sich alle LLMs daran halten, damit verschiedene nachgelagerte Anwendungen wissen, was passieren wird.“
2. Analyse der Ablehnungsrate. LLM ist zu einer Epidemie mit übermäßig vorsichtigen Antworten auf viele „unschuldige Fragen“ geworden. Claude hat sich für sichere KI-Forschung eingesetzt und Anstrengungen in diesem Bereich unternommen.
3. Anspruchsvolle visuelle Funktionen, vergleichbar mit anderen führenden Modellen. Funktioniert mit einer Vielzahl visueller Formate, darunter Fotos, Diagramme, Grafiken und technische Diagramme, PDFs, Flussdiagramme oder Präsentationsfolien.
Wie ist die eigentliche Bewertung?
Ein Internetnutzer hat GPT4 und Claude3 gebeten, jeweils einen Login-Schnittstellencode zu schreiben. Die tatsächlichen Testergebnisse (Abbildung 13) zeigen, dass letzterer im App-Schnittstellendesign besser ist.
.
Das obige ist der detaillierte Inhalt vonClaude3 hat GPT4 eine Lektion erteilt! Der stärkste Gegner von Open AI ist eine Late-Night-Bombe mit vollständiger Bildanalyse!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!