Claude3 wird veröffentlicht. Wird es GPT-4 vollständig übertreffen?-web3.0-php.cn

Soeben hat Anthropic die Einführung der Modellreihe Claude 3 angekündigt, die bei einem breiten Spektrum kognitiver Aufgaben einen neuen Branchenmaßstab setzt. Das Sortiment umfasst drei hochmoderne Modelle, die in aufsteigender Reihenfolge ihrer Leistungsfähigkeit angeordnet sind: Claude 3 Haiku, Claude 3 Sonnet und Claude 3 Opus. Jedes nachfolgende Modell bietet eine immer leistungsfähigere Leistung, sodass Benutzer das beste Gleichgewicht zwischen Intelligenz, Geschwindigkeit und Kosten für ihre spezifischen Anwendungen wählen können.

Opus und Sonnet sind jetzt in claude.ai und der Claude API verfügbar, wobei letztere jetzt in 159 Ländern vollständig verfügbar ist. Haiku wird bald verfügbar sein.

Modellreihe Claude 3

Claude3 发布，或将全面超越 GPT-4？

Ein neuer Standard in Sachen Intelligenz

Opus, das intelligenteste Modell von Anthropic, schneidet bei den meisten gängigen Bewertungsbenchmarks für KI-Systeme gut ab, einschließlich Expertenwissen auf Bachelor-Niveau (MMLU) und Expertenbegründung auf Graduiertenniveau (GPQA). ), Grundmathematik (GSM8K) usw. Es demonstriert ein nahezu menschliches Verständnis und eine fließende Bewältigung komplexer Aufgaben und führt damit die Grenze der allgemeinen Intelligenz an.

Das Claude 3-Modell zeigt starke Fähigkeiten in der Analyse und Vorhersage, detailliert in der Inhaltserstellung, Codegenerierung und der Führung von Gesprächen in nicht-englischen Sprachen wie Spanisch, Japanisch und Französisch.

So vergleicht sich das Claude-3-Modell mit seinen Anthropic-Gegenstücken bei mehreren Leistungsbenchmarks[1]:

Claude3 发布，或将全面超越 GPT-4？

Nahezu sofortige Ergebnisse

Das Claude-3-Modell kann sofortigen Kundenchat, automatische Vervollständigung und Datenextraktionsaufgaben unterstützen, bei denen Antworten erforderlich sind unmittelbar und in Echtzeit sein.

Im Bereich Intelligenz ist Haiku ein äußerst kostengünstiges Modell mit der schnellsten Geschwindigkeit auf dem Markt. Es war in der Lage, ein informationsreiches arXiv-Forschungspapier (ca. 10.000 Token) mit Diagrammen und Grafiken in weniger als drei Sekunden zu entschlüsseln. Anthropic wird seine Leistung in naher Zukunft weiter optimieren und auch die Leistung von Haiku wird verbessert.

Sonnet ist bei den meisten Arbeitslasten mehr als doppelt so schnell wie Claude 2 und Claude 2.1 und verfügt über ein höheres Maß an Intelligenz. Es eignet sich hervorragend für Aufgaben, die schnelle Reaktionen erfordern, wie z. B. Wissensabruf oder Vertriebsautomatisierung. Das Opus ist ähnlich schnell wie Claude 2 und 2.1, weist jedoch ein höheres Maß an Intelligenz auf.

Leistungsstarke visuelle Fähigkeiten

Das Claude 3-Modell verfügt über ausgefeilte visuelle Fähigkeiten, die mit anderen führenden Modellen vergleichbar sind. Sie können eine Vielzahl visueller Formate verarbeiten, darunter Fotos, Diagramme, Grafiken und technische Diagramme. Anthropic freut sich besonders, diese neue Modalität Unternehmenskunden anbieten zu können, von denen einige bis zu 50 % ihrer Wissensdatenbanken in verschiedenen Formaten wie PDFs, Flussdiagrammen oder Präsentationsfolien kodiert haben.

Claude3 发布，或将全面超越 GPT-4？

Reduktion von Ablehnungen

Das vorherige Claude-Modell führte häufig zu unnötigen Ablehnungen, was auf einen Mangel an Kontextverständnis hindeutet. Anthropic hat in dieser Hinsicht erhebliche Fortschritte gemacht: Opus, Sonnet und Haiku verweigern deutlich seltener die Antwort auf Eingabeaufforderungen, die sich der Alarmlinie des Systems nähern, viel seltener als bei früheren Modellen. Wie in der Abbildung unten gezeigt, verfügt das Claude-3-Modell über ein differenzierteres Verständnis von Anfragen, identifiziert echten Schaden und weigert sich deutlich seltener, auf harmlose Aufforderungen zu antworten.

Claude3 发布，或将全面超越 GPT-4？

Verbesserte Genauigkeit

Unternehmen aller Größen verlassen sich auf die Modelle von Anthropic, um ihre Kunden zu bedienen. Daher ist es von entscheidender Bedeutung, dass die Modellausgabe von Anthropic im Maßstab hochpräzise bleibt. Um dies zu beurteilen, nutzte Anthropic eine Vielzahl komplexer, sachlicher Fragen, die auf bekannte Schwächen aktueller Modelle abzielen. Anthropic klassifiziert Antworten in richtige Antworten, falsche Antworten (oder Halluzinationen) und Eingeständnisse von Unsicherheit, wobei das Modell zum Ausdruck bringt, die Antwort nicht zu kennen, anstatt falsche Informationen bereitzustellen. Im Vergleich zu Claude 2.1 erzielte Opus bei diesen anspruchsvollen offenen Fragen eine zweifache Verbesserung der Genauigkeit (oder korrekten Antworten) und reduzierte gleichzeitig die Anzahl falscher Antworten.

Zusätzlich zur Erstellung vertrauenswürdigerer Antworten wird Anthropic bald Zitate in den Claude-3-Modellen von Anthropic ermöglichen, sodass sie auf präzise Sätze in Referenzen verweisen können, um ihre Antworten zu überprüfen.

Claude3 发布，或将全面超越 GPT-4？

Langer Kontext und nahezu perfekte Erinnerung

Modelle der Claude 3-Serie bieten beim Start ein Kontextfenster mit 200.000 Mark. Alle drei Modelle sind jedoch in der Lage, Eingaben von über 1 Million Token zu akzeptieren, die Anthropic bestimmten Kunden anbieten kann, die eine höhere Verarbeitungsleistung benötigen.

Um lange kontextbezogene Hinweise effektiv verarbeiten zu können, benötigt das Modell starke Erinnerungsfähigkeiten. „Needle In A Haystack“ (NIAH) bewertet die Fähigkeit eines Messmodells, Informationen aus einem großen Datenbestand genau abzurufen. Anthropic erhöht die Robustheit dieses Benchmarks, indem es eines von 30 zufälligen Pin/Fragen-Paaren für jede Eingabeaufforderung verwendet und anhand eines vielfältigen Crowdsourcing-Korpus von Dokumenten testet.

Claude 3 Opus erreicht nicht nur eine nahezu perfekte Erinnerung mit einer Genauigkeit von über 99 %, sondern erkennt in einigen Fällen sogar Einschränkungen in der Auswertung selbst, indem es „Nadel“-Sätze identifiziert, die scheinbar künstlich in das Originaltextgeschlecht eingefügt wurden.

Claude3 发布，或将全面超越 GPT-4？

Verantwortungsvolles Design

Anthropic hat die Modellreihe Claude 3 entwickelt, um Zuverlässigkeit und Leistungsfähigkeit zu bieten. Anthropic verfügt über mehrere engagierte Teams, die Risiken verfolgen und mindern, die von Fehlinformationen und CSAM bis hin zu Biomissbrauch, Wahleinmischung und autonomen Replikationsfähigkeiten reichen. Anthropic entwickelt weiterhin Methoden wie Constitutional AI, um die Sicherheit und Transparenz der Modelle von Anthropic zu verbessern und die Modelle von Anthropic anzupassen, um Datenschutzbedenken auszuräumen, die sich aus neuen Modalitäten ergeben können.

Die Beseitigung von Verzerrungen in immer komplexeren Modellen ist eine kontinuierliche Anstrengung, und Anthropic macht mit dieser neuen Version Fortschritte. Wie in der Modellkarte gezeigt, weist Claude 3 laut Bias Question Answering Benchmark (BBQ) weniger Voreingenommenheit auf als das Vorgängermodell von Anthropic. Anthropic setzt sich weiterhin für die Weiterentwicklung von Technologien ein, die Voreingenommenheit reduzieren und eine größere Neutralität der Modelle fördern, um sicherzustellen, dass diese nicht auf eine bestimmte parteiische Position ausgerichtet sind.

Während die Modellreihe Claude 3 im Vergleich zu früheren Modellen Verbesserungen in Bezug auf biologisches Wissen, Cyber-bezogenes Wissen und Autonomie bietet, bleibt sie gemäß der Responsible Scaling Policy von Anthropic auf AI Safety Level 2 (ASL-2). Die Red-Team-Bewertung von Anthropic (durchgeführt im Einklang mit den Verpflichtungen von Anthropic im Weißen Haus und der US-Exekutivverordnung von 2023) kam zu dem Schluss, dass die aktuellen Modelle ein vernachlässigbares Katastrophenrisiko aufweisen. Anthropic wird künftige Modelle weiterhin genau beobachten, um zu beurteilen, wie nahe sie der ASL-3-Schwelle kommen. Weitere Sicherheitsdetails finden Sie auf der Modellkarte Claude 3.

Einfacher zu bedienen

Das Modell Claude 3 ist besser darin, komplexe mehrstufige Anweisungen zu befolgen. Sie sind besonders gut darin, die Richtlinien zur Markenstimme und -reaktion zu befolgen und kundenorientierte Erlebnisse zu entwickeln, denen Benutzer vertrauen können. Darüber hinaus bietet das Claude 3-Modell eine bessere Leistung bei der Generierung gängiger strukturierter Ausgaben, wie z. B. JSON-Formate, wodurch es einfacher wird, Claude für Anwendungsfälle wie die Klassifizierung natürlicher Sprache und die Stimmungsanalyse zu trainieren.

Modelldetails

Claude 3 Opus ist das intelligenteste Modell von Anthropic und zeigt die beste Leistung auf dem Markt bei hochkomplexen Aufgaben. Es fließt brillant in offenen Aufforderungen und unsichtbaren Situationen mit menschenähnlichem Verständnis. Opus zeigt Anthropic die Grenzen dessen, was mit generativer KI möglich ist.

Claude3 发布，或将全面超越 GPT-4？

Claude 3 Sonnet schafft die ideale Balance zwischen Intelligenz und Geschwindigkeit – insbesondere für Unternehmens-Workloads. Es bietet leistungsstarke Leistung zu geringeren Kosten als seine Mitbewerber und ist auf eine hohe Haltbarkeit für groß angelegte KI-Einsätze ausgelegt.

Claude3 发布，或将全面超越 GPT-4？

Claude 3 Haiku ist das schnellste und kompakteste Modell von Anthropic und ermöglicht eine nahezu sofortige Reaktion. Es beantwortet einfache Fragen und Wünsche mit beispielloser Geschwindigkeit. Benutzer können nahtlose KI-Erlebnisse erstellen, die menschliche Interaktionen simulieren.

Claude3 发布，或将全面超越 GPT-4？

Modellverfügbarkeit

Opus und Sonnet sind ab heute in der API von Anthropic verfügbar, die jetzt allgemein verfügbar ist und Entwickler sich anmelden und sofort mit der Nutzung dieser Modelle beginnen können. Haiku wird bald verfügbar sein. Sonnet ermöglicht das kostenlose Erlebnis auf claude.ai, während Opus für Claude Pro-Abonnenten verfügbar ist.

Sonnet ist auch über Amazons Bedrock und Google Clouds Vertex AI Model Garden erhältlich, Opus und Haiku folgen in Kürze.

Intelligenter, schneller, sicherer

Anthropic ist davon überzeugt, dass die Modellintelligenz noch lange nicht an ihre Grenzen stößt und plant, die Modellreihe Claude 3 in den nächsten Monaten regelmäßig zu aktualisieren. Anthropic freut sich außerdem, eine Reihe von Funktionen veröffentlichen zu können, um die Fähigkeiten der Anthropic-Modelle zu verbessern, insbesondere für Unternehmensanwendungsfälle und groß angelegte Bereitstellungen. Zu diesen neuen Funktionen gehören die Tool-Nutzung (auch als Funktionsaufrufe bezeichnet), interaktive Codierung (auch als REPL bezeichnet) und erweiterte Agentenfunktionen.

Das obige ist der detaillierte Inhalt vonClaude3 wird veröffentlicht. Wird es GPT-4 vollständig übertreffen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7505

CakePHP-Tutorial

1378

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Was sind die zehn besten Handelsplattformen für virtuelle Währung? Feb 20, 2025 pm 02:15 PM

Mit der Popularität von Kryptowährungen sind virtuelle Währungshandelsplattformen entstanden. Die zehn besten Handelsplattformen der virtuellen Währung der Welt werden nach dem Transaktionsvolumen und dem Marktanteil wie folgt eingestuft: Binance, Coinbase, FTX, Kucoin, Crypto.com, Kraken, Huobi, Gate.io, Bitfinex, Gemini. Diese Plattformen bieten eine breite Palette von Dienstleistungen, die von einer Vielzahl von Kryptowährungsauswahl bis hin zu Derivatenhandel reichen und für Händler unterschiedlicher Ebene geeignet sind.

So passen Sie den Sesam offenen Austausch in Chinesisch an Mar 04, 2025 pm 11:51 PM

Wie kann ich den Sesam offenen Austausch an Chinesisch anpassen? Dieses Tutorial behandelt detaillierte Schritte zu Computern und Android -Mobiltelefonen, von der vorläufigen Vorbereitung bis hin zu operativen Prozessen und dann bis zur Lösung gemeinsamer Probleme, um die Sesam -Open Exchange -Schnittstelle auf Chinesisch zu wechseln und schnell mit der Handelsplattform zu beginnen.

Muss ich Flexbox in der Mitte des Bootstrap -Bildes verwenden? Apr 07, 2025 am 09:06 AM

Es gibt viele Möglichkeiten, Bootstrap -Bilder zu zentrieren, und Sie müssen keine Flexbox verwenden. Wenn Sie nur horizontal zentrieren müssen, reicht die Text-Center-Klasse aus. Wenn Sie vertikal oder mehrere Elemente zentrieren müssen, ist Flexbox oder Grid besser geeignet. Flexbox ist weniger kompatibel und kann die Komplexität erhöhen, während das Netz leistungsfähiger ist und höhere Lernkosten hat. Bei der Auswahl einer Methode sollten Sie die Vor- und Nachteile abwägen und die am besten geeignete Methode entsprechend Ihren Anforderungen und Vorlieben auswählen.

Top 10 Top -Currency -Handelsplattformen 2025 Cryptocurrency Trading Apps, die die Top Ten ringen Mar 17, 2025 pm 05:54 PM

Top Ten Ten Virtual Currency Trading Platforms 2025: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Berechnung des C-Subscript 3-Index 5 C-Subscript 3-Index 5-Algorithmus-Tutorial Apr 03, 2025 pm 10:33 PM

Die Berechnung von C35 ist im Wesentlichen kombinatorische Mathematik, die die Anzahl der aus 3 von 5 Elementen ausgewählten Kombinationen darstellt. Die Berechnungsformel lautet C53 = 5! / (3! * 2!), Was direkt durch Schleifen berechnet werden kann, um die Effizienz zu verbessern und Überlauf zu vermeiden. Darüber hinaus ist das Verständnis der Art von Kombinationen und Beherrschen effizienter Berechnungsmethoden von entscheidender Bedeutung, um viele Probleme in den Bereichen Wahrscheinlichkeitsstatistik, Kryptographie, Algorithmus -Design usw. zu lösen.

Top 10 Cryptocurrency -Handelsplattformen, Top Ten empfohlene Apps für Währungshandelsplattformen Mar 17, 2025 pm 06:03 PM

Zu den zehn Top -Kryptowährungsplattformen gehören: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Was sind die sicheren und zuverlässigen digitalen Währungsplattformen? Mar 17, 2025 pm 05:42 PM

Eine sichere und zuverlässige Plattform für digitale Währung: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Welcher der zehn besten Apps für virtuelle Währung ist die besten? Mar 19, 2025 pm 05:00 PM

Top 10 Apps Rankings von Virtual Currency Trading: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundenbetreuung sollten bei der Auswahl einer Plattform berücksichtigt werden.