Zhipu AI bringt das große Basismodell ChatGLM3 der dritten Generation auf den Markt, um es an mehr inländische Chips anzupassen-KI-php.cn

Heim

Zhipu AI bringt das große Basismodell ChatGLM3 der dritten Generation auf den Markt, um es an mehr inländische Chips anzupassen

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 30, 2023 pm 06:05 PM

Die Nachricht vom 27. Oktober 2023 ist, dass Zhipu AI auf der China Computer Conference (CNCC) ein neues, selbst entwickeltes großes Basismodell der dritten Generation, ChatGLM3, und zugehörige Produktserien vorgestellt hat. Diese Veröffentlichung markiert einen großen Durchbruch für Zhipu AI nach der Einführung der 100-Milliarden-Basis-Konversationsmodelle ChatGLM und ChatGLM2

ChatGLM3 wird unter Verwendung einer originellen mehrstufigen, verbesserten Vortrainingsmethode entwickelt. Diese Methode kann das Training vollständiger machen. Den Bewertungsergebnissen zufolge belegte ChatGLM3 in 44 öffentlichen Datensatztests auf Chinesisch und Englisch den ersten Platz unter inländischen Modellen gleicher Größe. Zhang Peng, CEO von Zhipu AI, stellte auf der Pressekonferenz neue Produkte vor und demonstrierte die neuesten Produktfunktionen in Echtzeit

ChatGLM3 neues Technologie-Upgrade mit höherer Leistung und geringeren Kosten

ChatGLM3, das von Zhipu AI eingeführt wurde, ist mit umfangreicheren Trainingsdaten und besseren Trainingslösungen leistungsfähiger geworden. Im Vergleich zu ChatGLM2 stieg MMLU um 36 %, CEval um 33 %, GSM8K um 179 % und BBH um 126 %

Gleichzeitig zielt ChatGLM3 auf GPT-4V ab und hat iterative Upgrades mehrerer neuer Funktionen implementiert, darunter CogVLM mit multimodalen Verständnisfähigkeiten – Bilderkennungssemantik, die SOTA für mehr als 10 internationale Standard-Grafikauswertungsdatensätze erreicht hat; Code Das erweiterte Modul Code Interpreter generiert Code und führt ihn entsprechend den Benutzeranforderungen aus. Dabei werden komplexe Aufgaben wie Datenanalyse und Dateiverarbeitung automatisch ausgeführt. Die Erweiterung der Netzwerksuche kann anhand von Fragen automatisch nach relevanten Informationen im Internet suchen und diese bereitstellen Bitte geben Sie bei der Beantwortung relevante Referenzen an. Die semantischen und logischen Fähigkeiten von ChatGLM3 wurden erheblich verbessert.

ChatGLM3 integriert auch die selbst entwickelte AgentTuning-Technologie, die die Funktionen des Modellagenten aktiviert, insbesondere im Hinblick auf intelligente Planung und Ausführung, die im Vergleich zu ChatGLM2 um 1000 % verbessert ist; sie ermöglicht es auch inländischen großen Modellen, Toolaufrufe und Codeausführung nativ zu unterstützen , Spiele, Datenbankoperationen, Suche und Argumentation in Wissensgraphen, Betriebssysteme und andere komplexe Szenarien.

Darüber hinaus bringt ChatGLM3 dieses Mal die Endtestmodelle ChatGLM3-1.5B und ChatGLM3-3B auf den Markt, die auf Mobiltelefonen eingesetzt werden können. Sie unterstützen eine Vielzahl von Mobiltelefonen und fahrzeugmontierten Plattformen, darunter vivo, Xiaomi und Samsung Unterstützt die Inferenz von CPU-Chips auf mobilen Plattformen. Die Geschwindigkeit kann 20 Token/s erreichen. In Bezug auf die Genauigkeit liegt die Leistung der 1.5B- und 3B-Modelle bei öffentlichen Benchmarks nahe an der des ChatGLM2-6B-Modells.

Basierend auf der neuesten effizienten dynamischen Inferenz- und Speicheroptimierungstechnologie, dem aktuellen Inferenz-Framework von ChatGLM3 unter denselben Hardware- und Modellbedingungen, verglichen mit der derzeit besten Open-Source-Implementierung, einschließlich vLLM, das von der University of Berkeley eingeführt wurde, und der neuesten Version von Hugging Face TGI, Inferenz Die Geschwindigkeit wird um das 2-3-fache erhöht und die Inferenzkosten werden verdoppelt. Es beträgt nur 0,5 Punkte pro tausend Token und die Kosten sind am niedrigsten.

Dieser Inhalt dient nur als Referenz und stellt keine Anlageberatung dar. Leser sollten bei der Verwendung dieser Informationen ihr eigenes Urteilsvermögen anwenden und die Verantwortung für ihre eigenen Entscheidungen übernehmen. Diese Website ist nicht verantwortlich für Verluste, die durch die Verwendung dieser Inhalte entstehen

Dieses Konto gibt keine Aussage oder Garantie hinsichtlich der Verfügbarkeit, Genauigkeit, Aktualität, Gültigkeit oder Vollständigkeit der veröffentlichten Informationen ab und lehnt hiermit jegliche Haftung oder Konsequenzen ab, die sich aus den Informationen ergeben könnten. Nach dem Umschreiben: Dieses Konto gibt keine Zusicherungen oder Garantien hinsichtlich der Verfügbarkeit, Genauigkeit, Aktualität, Gültigkeit oder Vollständigkeit der veröffentlichten Informationen ab und übernimmt keinerlei Haftung oder Konsequenzen in dieser Erklärung

2. Dieser Account ist nicht kommerziell und gemeinnützig. Der wiedergegebene Inhalt bedeutet nicht, dass Sie mit seinen Ansichten einverstanden sind und für seine Authentizität verantwortlich sind, noch stellt er eine andere Orientierung dar. Diese Website übernimmt keine direkte oder indirekte Haftung für Ungenauigkeiten oder Fehler in den reproduzierten oder veröffentlichten Informationen.

3. Die in diesem Artikel verwendeten Informationen, Materialien, Texte, Bilder usw. stammen aus dem Internet und alle wiedergegebenen Inhalte sind mit der Quelle gekennzeichnet. Wenn Sie ein Werk finden, das Ihre geistigen Eigentumsrechte oder persönlichen Rechte verletzt, kontaktieren Sie uns bitte und wir werden es rechtzeitig ändern oder löschen

Zhipu AI bringt das große Basismodell ChatGLM3 der dritten Generation auf den Markt, um es an mehr inländische Chips anzupassen

Das obige ist der detaillierte Inhalt vonZhipu AI bringt das große Basismodell ChatGLM3 der dritten Generation auf den Markt, um es an mehr inländische Chips anzupassen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Assassin's Creed Shadows: Seashell Riddle -Lösung

3 Wochen vor By DDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

2 Wochen vor By DDD

Assassins Creed Shadows - So finden Sie den Schmied und entsperren Sie die Waffen- und Rüstungsanpassung

1 Monate vor By DDD

Wo kann man die Kransteuerungsschlüsselkarten in Atomfall finden

3 Wochen vor By DDD

<🎜>: Dead Rails - wie man jede Herausforderung abschließt

3 Wochen vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7640

CakePHP-Tutorial

1391

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

150

Related knowledge

Top 5 Genai Starts vom Februar 2025: GPT-4,5, GROK-3 & MEHR! Mar 22, 2025 am 10:58 AM

Februar 2025 war ein weiterer bahnbrechender Monat für die Generative KI, die uns einige der am meisten erwarteten Modell-Upgrades und bahnbrechenden neuen Funktionen gebracht hat. Von Xais Grok 3 und Anthropics Claude 3.7 -Sonett, um g zu eröffnen

Wie benutze ich Yolo V12 zur Objekterkennung? Mar 22, 2025 am 11:07 AM

Yolo (Sie schauen nur einmal) war ein führender Echtzeit-Objekterkennungsrahmen, wobei jede Iteration die vorherigen Versionen verbessert. Die neueste Version Yolo V12 führt Fortschritte vor, die die Genauigkeit erheblich verbessern

Beste KI -Kunstgeneratoren (kostenlos & amp; bezahlt) für kreative Projekte Apr 02, 2025 pm 06:10 PM

Der Artikel überprüft Top -KI -Kunstgeneratoren, diskutiert ihre Funktionen, Eignung für kreative Projekte und Wert. Es zeigt MidJourney als den besten Wert für Fachkräfte und empfiehlt Dall-E 2 für hochwertige, anpassbare Kunst.

Ist Chatgpt 4 o verfügbar? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 ist derzeit verfügbar und weit verbreitet, wodurch im Vergleich zu seinen Vorgängern wie ChatGPT 3.5 signifikante Verbesserungen beim Verständnis des Kontextes und des Generierens kohärenter Antworten zeigt. Zukünftige Entwicklungen können mehr personalisierte Inters umfassen

Beste AI -Chatbots verglichen (Chatgpt, Gemini, Claude & amp; mehr) Apr 02, 2025 pm 06:09 PM

Der Artikel vergleicht Top -KI -Chatbots wie Chatgpt, Gemini und Claude und konzentriert sich auf ihre einzigartigen Funktionen, Anpassungsoptionen und Leistung in der Verarbeitung und Zuverlässigkeit natürlicher Sprache.

Erste Schritte mit Meta Lama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Metas Lama 3.2: Ein Sprung nach vorne in der multimodalen und mobilen KI Meta hat kürzlich Lama 3.2 vorgestellt, ein bedeutender Fortschritt in der KI mit leistungsstarken Sichtfunktionen und leichten Textmodellen, die für mobile Geräte optimiert sind. Aufbau auf dem Erfolg o

Top -KI -Schreibassistenten, um Ihre Inhaltserstellung zu steigern Apr 02, 2025 pm 06:11 PM

In dem Artikel werden Top -KI -Schreibassistenten wie Grammarly, Jasper, Copy.ai, Writesonic und RYTR erläutert und sich auf ihre einzigartigen Funktionen für die Erstellung von Inhalten konzentrieren. Es wird argumentiert, dass Jasper in der SEO -Optimierung auszeichnet, während KI -Tools dazu beitragen, den Ton zu erhalten

Leitfaden für die räumliche Indexierung von Uber ' s H3 Mar 22, 2025 am 10:54 AM

In der heutigen datengesteuerten Welt ist eine effiziente Geospatial-Indexierung für Anwendungen, die von Mitfahrgelegenheiten und Logistik bis hin zu Umweltüberwachung und Katastrophenreaktion reichen, von entscheidender Bedeutung. Ubers H3, ein mächtiger Open-Source-Spucke

See all articles