Heutzutage ist das Feld der großen Modelle noch größer! OpenAI veröffentlichte GPT4o auf dem Vorderfuß und kontrollierte das gesamte Spiel, wurde aber vom größten Konkurrenten Anthropic auf dem Hinterfuß übertroffen.
Gerade hat Anthropic ein neues großes Modell Claude 3.5 Sonnet herausgebracht, das angeblich das bislang intelligenteste Modell ist.
Berichten zufolge ist Claude 3.5 Sonnet die erste Version der kommenden Claude 3.5-Serie von Anthropic. Dieses Modell hat das Intelligenzniveau im gesamten Bereich verbessert und übertrifft in den meisten Benchmark-Bewertungen konkurrierende Großmodelle und seinen leistungsstärksten Vorgänger, den Claude 3 Opus. Gleichzeitig entsprechen Laufgeschwindigkeit und Kosten denen des Vorgängers Claude 3 Sonnet. Adresse: https://claude.ai/Derzeit ist Claude 3.5 Sonnet bereits kostenlos auf Claude.ai und der Claude iOS-App verfügbar, während Abonnenten des Claude Pro- und Team-Plans es erhalten können für einen höheren Preis, um darauf zuzugreifen. Darüber hinaus kann Claude 3.5 Sonnet bereits direkt über Anthropic API, Amazon Cloud Technology Bedrock und andere Kanäle genutzt werden. Der Preis beträgt 3 USD pro Million Eingabe-Token, 15 USD pro Million Ausgabe-Token und das Kontextfenster beträgt 200.000 Token.
Anthropic sagt, dass es darauf abzielt, alle paar Monate die Kompromisskurve zwischen Leistung, Geschwindigkeit und Kosten drastisch zu verbessern. Das Claude 3.5 Haiku und das Claude 3.5 Opus werden später in diesem Jahr veröffentlicht. Neben der Entwicklung der nächsten Generation großer Modelle entwickelt Anthropic neue Muster und Funktionen, um mehr Unternehmensanwendungsfälle zu unterstützen, einschließlich der Integration mit Unternehmensanwendungen. Das Team erforscht außerdem Funktionen wie Memory, die es dem Modell ermöglichen, sich an die Vorlieben des Benutzers und den angegebenen Interaktionsverlauf zu erinnern und so ein personalisierteres und effizienteres Erlebnis zu ermöglichen. 🔜 HumanEval ) setzt neue Branchenmaßstäbe . Es zeigt deutliche Verbesserungen beim Verständnis von Nuancen, Humor und komplexen Anweisungen und zeichnet sich durch das Verfassen hochwertiger Inhalte in einem natürlichen, zugänglichen Ton aus.
Claude 3.5 Sonnet läuft doppelt so schnell wie Claude 3 Opus. Diese Leistungssteigerung gepaart mit einem günstigen Preis macht das Claude 3.5 Sonnet ideal für komplexe Aufgaben.
In einer internen Proxy-Coding-Bewertung löste Claude 3.5 Sonnet 64 % der Probleme, besser als Claude 3 Opus (38 % gelöst). Die Anthropic-Evaluierung testete die Fähigkeit von Claude 3.5 Sonnet, Fehler zu beheben oder Funktionalität zur Open-Source-Codebasis hinzuzufügen, basierend auf Beschreibungen der Anforderungen in natürlicher Sprache.
Nachdem Claude 3.5 Sonnet Anleitung und relevante Tools erhalten hat, kann er selbstständig Code schreiben, bearbeiten und ausführen und verfügt über ausgefeilte Argumentations- und Fehlerbehebungsfunktionen. Claude 3.5 Sonnet kann die Codekonvertierung problemlos durchführen, was besonders effektiv für die Aktualisierung älterer Anwendungen und die Migration von Codebasen ist. Die folgende Tabelle vergleicht das Claude 3.5 Sonnet mit anderen Modellen. Die Bewertungsmaßstäbe umfassen Argumentation, Leseverständnis, Mathematik, Naturwissenschaften und Codierung. In all diesen Benchmarks schnitt das Claude 3.5 Sonnet besser ab als das bisherige Spitzenmodell, das Claude 3 Opus.
Wir können auch die Vergleichsdaten zwischen Claude3,5 und GPT-4o in der Tabelle sehen. Mit Ausnahme der Mathematik liegen die Ergebnisse höher oder nahe bei GPT-4o.
Das bisher stärkste visuelle ModellAnthropic sagt, dass das
Claude 3.5 Sonnet sein stärkstes visuelles Modell ist und seinen Vorgänger Claude 3 Opus
in allen standardmäßigen visuellen Benchmarks übertrifft. Leistung zeigt sich besonders bei Aufgaben, die visuelles Denken erfordern, wie z. B. beim Interpretieren von Diagrammen, Grafiken oder beim Transkribieren von Text aus unvollständigen Bildern, einer Kernfunktion in der Einzelhandels-, Logistik- und Finanzdienstleistungsbranche. In diesen Bereichen kann KI aus Bildern, Grafiken oder Illustrationen mehr Erkenntnisse gewinnen als aus Text allein.
Das Bild unten zeigt den Leistungsvergleich zwischen Claude 3.5 Sonnet und Claude 3 Opus, GPT-4o, Gemini 1.5 Pro in den Bereichen visuelles mathematisches Denken, wissenschaftliche Diagramme, visuelle Beantwortung von Fragen, Diagramm-QA und visuelle Dokument-QA-Aufgaben.
Artifacts – Neue Möglichkeiten, Claude zu nutzen Anthropic hat außerdem Artifacts auf Claude.ai eingeführt, eine neue Funktion, die die Art und Weise erweitert, wie Benutzer mit Claude interagieren. Wenn Benutzer Claude bitten, etwas wie einen Codeausschnitt, ein Textdokument oder ein Website-Design zu erstellen, werden diese Artefakte in einem speziellen Fenster neben ihrer Konversation angezeigt. Dadurch entsteht ein dynamischer Arbeitsbereich, in dem sie Claudes Kreationen in Echtzeit ansehen, bearbeiten und weiterentwickeln können und dabei KI-generierte Inhalte nahtlos in ihre Projekte und Arbeitsabläufe integrieren können. Die Vorschaufunktion für Artefakte markiert Claudes Entwicklung von der Konversations-KI zu einer kollaborativen Arbeitsumgebung und wird bald erweitert, um die Zusammenarbeit im Team zu unterstützen. In naher Zukunft können Teams ihr Wissen, ihre Dokumentation und ihre laufenden Arbeiten sicher in einem gemeinsamen Raum zentralisieren, wobei Claude bei Bedarf als Teamkollege fungiert. Abschließend sagt Anthropic, dass sie das Modell gründlich testen und sich dafür einsetzen, sein Missbrauchspotenzial zu reduzieren. Das Anthropic-Sicherheitsteam führte eine Reihe von Bewertungen von Claude 3.5 Sonnet in den Bereichen chemische, biologische, radiologische und nukleare (CBRN) Risiken, Cybersicherheit und autonome Fähigkeiten durch und stufte Claude 3.5 Sonnet schließlich als KI-Sicherheitsstufe 2 ein (ASL-2)-Modell, was darauf hinweist, dass kein Risiko einer katastrophalen Verletzung besteht. Darüber hinaus arbeitet Anthropic im Rahmen seines Engagements für Sicherheit und Transparenz mit externen Experten zusammen, um die Sicherheitsmechanismen in diesem neuesten Modell zu testen und zu verfeinern. Offizielle Blog-Adresse: https://www.anthropic.com/news/claude-3-5-sonnetDas obige ist der detaillierte Inhalt vonSchlage GPT-4o! Das neue King Claude 3.5 Sonnet ist da und direkt kostenlos erhältlich. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!