China hat es mit seinen KI -Modellen wieder getan und diesmal ist der Schlag größer und besser! BAIDU - Eine chinesische KI -Firma, kürzlich zwei große Sprachmodelle (LLMs) veröffentlicht - Ernie 4.5 & X1. Diese Modelle behaupten, eine bessere Leistung als das neueste und größte Modell von Openai zu erzielen-GPT-4,5-und sind kostengünstiger als Deepseek-R1! Die Modelle scheinen zu gut zu sein, um wahr zu sein - und bieten eine hohe Qualität zu einem Bruchteil des Preises. In diesem Blog werden wir die Ernie 4.5- und X1-Modelle untersuchen, ihre Benchmark-Ergebnisse bewerten und sehen, wie sie in realen Anwendungen abschneiden. Also fangen wir an.
Ernie 4.5 & X1 sind die beiden neuesten multimodalen LLMs, die vom führenden chinesischen Technologieunternehmen Baidu entwickelt wurden und sich auf Internetdienste, künstliche Intelligenz und autonomes Fahren spezialisiert haben. Es ist am besten für seine dominierende Suchmaschine in China und die Fortschritte in KI-gesteuerten Innovationen bekannt. Baidu startete im Dezember 2021 seinen ersten LLM, Ernie 3.0 Titan. Danach hat es einige weitere Modelle veröffentlicht und gleichzeitig daran gearbeitet, robustere LLMs zu erstellen. Das Ergebnis aller Forschung und kontinuierlichen Bemühungen ist Ernie 4.5 & X1.
Ernie 4.5 ist ein multimodales Fundamentmodell, das verschiedene Datentypen verstehen und integrieren kann, einschließlich Text, Bilder, Audio und Video. Dieser vielfältige Modellierungsansatz verbessert seine Fähigkeit, verschiedene Arten von Inhalten zu verstehen und zu generieren.
Hier sind einige der Hauptmerkmale von Ernie 4.5:
Ernie X1 ist als tief denkender Argumentationsmodell mit multimodalen Fähigkeiten konzipiert. Es ist ein erstes von Baidu veröffentlichtes Modell mit tiefem Denken. Hier sind einige seiner Schlüsselmerkmale:
Sie können entweder über ihren AI -Chatbot - Ernie Bot oder über APIs auf Ernie 4.5 & X1 zugreifen.
Zugriff über Bot:
Beide Modelle sind für einzelne Benutzer auf der Ernie Bot -Plattform von Baidu frei zugänglich. Die Registrierung für Ernie Bot ist derzeit auf chinesische Staatsangehörige beschränkt.
Zugriff über API:
Derzeit kann auf die Plattform von allen Benutzern nicht zugegriffen werden. Außerdem ist nur Ernie 4.5 über API erhältlich, während Ernie X1 bald auf der Plattform verfügbar sein wird.
In diesem Abschnitt werden wir herausfinden, wie diese Modelle bei Aufgaben mit Multimedia, Argumentation, Dokumentanalyse und vielem mehr ausgeführt werden. Da die Modellschnittstelle nur die chinesische Sprache unterstützt und die Darstellung der Account auf chinesische Staatsangehörige beschränkt ist, werden wir uns einige Beispiele dafür ansehen, wie Menschen die beiden Modelle verwenden, und welche Ausgaben sie erhalten haben. Wir werden einige der häufigsten Anwendungsfälle von Ernie 4.5 & X1 abdecken, die wir online gefunden haben, darunter:
In dieser Aufgabe wurde das Modell gebeten, ein mathematisches Problem zu lösen, das ihm in Form eines Bildes gegeben wurde.
Verwendete Modell: Ernie 4.5
Ausgabe:
Wie die meisten anderen multimodalen LLMs analysiert Ernie 4.5 das Video schnell und löst das Problem im Bild. Es nimmt alle Fragen im Bild nacheinander und fasst sie schließlich alle zusammen. Die Geschwindigkeit und Genauigkeit seiner Leistung macht es zu einem nützlichen Instrument für Studenten, Pädagogen, Forscher und Fachkräfte, die eine schnelle und genaue Problemlösung benötigen.
Hier erhielt das Modell ein Dokument und musste die Informationen zu einem bestimmten Thema aus diesem Dokument zusammenfassen.
Verwendete Modell: Ernie 4.5
Ausgabe:
Mit dem Modell können Sie mehrere Dateien verschiedener Typen auf einmal hochladen. Es ist in der Lage, Dateien verschiedener Typen zu verarbeiten, einschließlich Dokumenten, PDFs, PPTs, Excel -Blättern und vielem mehr. In den hochgeladenen Dateien können Sie die (oder mehr) auswählen, über die Sie den Chatbot abfragen möchten, und das Modell fasst das Thema schnell zusammen. Die schnelle Verarbeitung mehrerer Dateien kann für Aufgaben wie Forschungsanalyse, Überprüfung der Rechtsdokumente, Finanzdatenextraktion und Unternehmensberichterstattung sehr nützlich sein.
Für diese Aufgabe musste das Modell das gegebene Audio analysieren und seine Quelle finden.
Verwendete Modell: Ernie 4.5
Ausgabe:
Die Audioanalyse ist eine Funktion, die keiner der beliebten KI -Chatbots in ihre Schnittstelle integriert hat, wodurch Ernie 4.5, die erste ihrer Art. Das Modell analysiert schnell den Clip, bestimmt seine Quelle und beschreibt dann sogar die Bedeutung des Clips. Die schnelle Analyse und die detaillierte Beschreibung machen es zu einem wertvollen Instrument für Aufgaben wie Echtzeit-Transkription, sprachbasierte Suche, Deepfake-Erkennung und Stimmungsanalyse in den Bereichen Medien, Kundendienst, Bildung und Strafverfolgung.
Für diese Aufgabe musste das Modell einen Raum analysieren und mögliche Dekorationen vorschlagen, die seine allgemeine Attraktivität verbessern können. Es musste dann ein aktualisiertes Bild des Raumes generieren.
Verwendete Modell: Ernie x1
Ausgabe:
Das Modell verarbeitet das Bild schnell. Es schlägt dann die möglichen Verbesserungen an der Dekor des Raums vor, um die Gesamtattraktivität zu verbessern. Schließlich erzeugt es das Bild des Raums mit allen vorgeschlagenen Verbesserungen. Diese Funktion ist eine großartige Ergänzung für Aufgaben wie Innenarchitektur, Renovierungsplanung, Immobilienbühnen und virtuelle Dekorvisualisierung.
HINWEIS: Wir haben die Beispiele aus diesem Beitrag auf X genommen.
Sowohl Ernie 4.5 und X1 haben alle Funktionen und noch mehr als die Topmodelle von OpenAI, Deepseek, Grok, Claude usw. Hier finden Sie eine Preisaufschlüsselung der beiden Modelle:
Modell | Eingangspreis (pro Million Token) | Ausgangspreis (pro Million Token) | Verfügbarkeit |
Ernie 4.5 | $ 0,55 | $ 2,20 | Verfügbar |
Ernie x1 | $ 0,28 | $ 1,10 | Noch nicht verfügbar |
Im Vergleich zu anderen Topmodellen sind Ernie 4.5 und X1 deutlich billiger, was sie zu einem wertvollen Kapital bei der Weiterentwicklung der generativen KI macht.
Wir haben bereits die Funktionen, Funktionen und die Preisgestaltung der neuesten Ernie -Modelle gesehen. Schauen wir uns nun einige Leistungszahlen dieser Modelle gegen Top-Modelle wie GPT-4,5, GPT-4O, Deepseek-R1 und mehr an.
Die folgende Grafik vergleicht Ernie 4.5 und GPT-4O über mehrere Benchmarks, die die multimodale KI-Leistung testen.
Die Grafik zeigt das:
Das nächste Diagramm vergleicht Ernie 4.5, Deepseek V3-CHAT, GPT-4O und GPT-4,5 über mehrere Benchmarks für textbasierte Argumentation und Problemlösung.
Hier sind einige wichtige Imbissbuden aus der Grafik:
Das Rennen um das Top -LLM ist heizen und Baidus Ernie 4.5 & X1 führt einen ernsthaften Wettbewerb um OpenAI, Deepseek, Anthropic und Meta ein. Da die chinesischen KI -Labors Modelle liefern, die die westliche KI zu einem Bruchteil der Kosten konkurrieren oder übertreffen, werden Unternehmen gezwungen sein, schneller zu innovieren und ihre Kosten zu senken, um wettbewerbsfähig zu bleiben.
All diese Fortschritte werden endlich zu:
Die Ernie 4.5- und X1 -Modelle von Baidu sind nicht nur ein weiterer Satz von KI -Modellen - sie sind Branchenstörer. Ihre überlegenen multimodalen und argumentationsfähigen Fähigkeiten, niedrige Preisgestaltung und eine tiefe Integration in das digitale Ökosystem Chinas signalisieren eine Leistungsverschiebung auf dem globalen KI -Markt.
Wenn dieser Trend weitergeht, würden wir eine größere AI -Demokratisierung und Öffentlichkeitsarbeit in verschiedenen Branchen sehen. Dies würde auch viele westliche Unternehmen dazu veranlassen, billigere Modelle zu veröffentlichen. Dies würde dies nicht nur zur Wettbewerbsfähigkeit auf dem Markt beitragen, sondern auch sicherstellen, dass die Benutzer das meiste Wert für ihr Geld erhalten.
A. Ernie 4.5 und X1 sind die von Baidu entwickelten großartigen großartigen Modelle (Language Models), die mit Top-KI-Modellen wie OpenAIs GPT-4,5 und Deepseek-R1 konzipiert wurden. Ernie 4.5 ist ein multimodales Fundamentmodell, während Ernie X1 ein tiefdenkendes Argumentationsmodell mit fortschrittlichen Funktionen ist.
Q2. Wie unterscheidet sich Ernie 4.5 von Baidu von Ernie X1?A. Ernie 4.5 ist für multimodales Verständnis optimiert, in der Lage, Text, Bilder, Audio und Video mit hoher Genauigkeit zu verarbeiten. Ernie X1 hingegen ist für tiefdenkende Denken, Exzellent im Kontextverständnis, Planen und Problemlösung mit Selbstreflexion ausgelegt.
Q3. Wie vergleichen sich Ernie 4.5 & X1 mit Openai's GPT-4,5?A. Baidu Ernie 4.5 übertrifft GPT-4,5 in mehreren Benchmarks, insbesondere in Bezug auf Argumentation, multimodales Verständnis und Halluzinationsprävention, während nur 1% des Preis von GPT-4,5 kostet. Ernie X1 liefert die Leistung von Deepseek-R1 auf die Hälfte der Kosten und macht sie wettbewerbsfähige KI-Lösungen.
Q4. Was sind die Preisdetails für Ernie 4.5 & X1? A. Ernie 4,5: Input kostet 0,55 USD pro 1 Mio. Token, die Ausgabe kostet 2,20 USD pro 1 Mio. Token.
Ernie X1: Eingabekosten kostet 0,28 USD pro 1 -Mio. -Token, die Ausgabe kostet 1,10 USD pro 1 Mio. Token.
Das Ernie X1 -Modell ist noch nicht über API verfügbar, wird aber bald sein.
A. Sie können auf diese Modelle zugreifen:
1. Ernie Bot (AI Chatbot) unter yiyan.baidu.com (nur für chinesische Benutzer verfügbar).
2. Die Maas -Plattform von Baidu Ai Cloud, Qianfan, für den API -Zugriff (derzeit ist nur Ernie 4.5 verfügbar).
Das obige ist der detaillierte Inhalt vonWird Baidus Ernie 4.5 & X1 GPT-4,5 und Deepseek-R1 ersetzen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!