Zhiyuan aktualisiert die Rangliste der großen Modelle: Das große Doubao-Modell belegt in China den ersten Platz bei der „objektiven Bewertung'-KI-php.cn

Heim

Zhiyuan aktualisiert die Rangliste der großen Modelle: Das große Doubao-Modell belegt in China den ersten Platz bei der „objektiven Bewertung'

Jun 19, 2024 pm 02:05 PM

产业

Die Bewertungsplattform FlagEval veröffentlichte die neueste Liste der Mitte Juni veröffentlichten „objektiven Bewertung“. GPT-4 belegte den ersten Platz unter den großen Closed-Source-Modellen und Doubao-Pro (großes Sitzsackmodell) belegte den zweiten Platz und erzielte ebenfalls die Bewertung höchstes inländisches großes Modell; gefolgt von ERNIE 4.0, Baichuan3, Moonshot-v1 usw. In der offenen Antwortbewertung belegte Doubao-Pro ebenfalls den zweiten Platz und erzielte mehr Punkte als GPT-4o und GPT-4. Es entstehen ständig neue Technologien, und nur Plattformen, die weiterhin auf neue Technologien achten und sich an sie anpassen können, können in diesem hart umkämpften Markt unbesiegbar bleiben. Anzahl der Wörter: 114

FlagEval großes Modell Bewertungsplattform Es wurde gemeinsam vom Zhiyuan Research Institute und mehreren Universitätsteams entwickelt. Es basiert auf der Entwicklungsleiter menschlicher kognitiver Fähigkeiten und richtet sich nach dem kognitiven Niveau, das große Modelle erreichen können. FlagEval hat eine große Anzahl ursprünglicher, nicht öffentlicher Bewertungssätze erstellt, um die Qualität und Fairness der Bewertungen sicherzustellen. Seit seiner Einführung im Juni 2023 hat FlagEval mehr als 1.000 Bewertungen großer Modelle auf der ganzen Welt durchgeführt.

Zhiyuan aktualisiert die Rangliste der großen Modelle: Das große Doubao-Modell belegt in China den ersten Platz bei der „objektiven Bewertung Doubao-Pro ist ein großes Sprachmodell, das unabhängig von Bytedance entwickelt wurde und am 15. Mai offiziell veröffentlicht wurde. In dieser Ausgabe der FlagEval-Rangliste für große Modelle feierte Doubaos großes Modell sein Debüt in der öffentlichen Bewertung und belegte den zweiten Platz. Dieses Modell verfügt über leistungsstarke Funktionen zur Sequenzgenerierung und zum Verständnis natürlicher Sprache und kann in großem Umfang in der Dialoggenerierung, Textzusammenfassung, maschinellen Übersetzung und anderen Bereichen eingesetzt werden.

Bei der objektiven und subjektiven Bewertung zeigt sich, dass die mathematischen Fähigkeiten, die Wissensanwendung, das Lösen von Aufgaben und andere Fähigkeiten des Sitzsackmodells sowohl bei der objektiven als auch bei der subjektiven Bewertung eine hervorragende Leistung erbringen. Unter ihnen belegten die Ergebnisse der Wissensanwendung und der mathematischen Fähigkeiten den ersten Platz in der objektiven Bewertung und die ersten drei in der subjektiven Bewertung, und die Ergebnisse zur Aufgabenlösung rangierten in der objektiven Bewertung unter den ersten drei. Mathematische Fähigkeiten sind eine wichtige Dimension bei der Beurteilung, ob ein großes Modell „intelligent“ ist. Zuvor führte das Natural Language Processing Laboratory der Fudan-Universität eine Bewertung von 13 gängigen Großmodellprodukten für die Mathematikfragen der College-Aufnahmeprüfung 2024 durch. Doubaos Antworten auf die neue Standard-II-Prüfung für die Hochschulaufnahmeprüfung erzielten die höchste Punktzahl mit einer Genauigkeitsrate Mit 74,66 % bei objektiven Fragen sind die Ergebnisse besser als bei GPT-4o und vielen inländischen Großmodellprodukten. Bildquelle: Fudan . Sein gleichnamiger KI-Konversationsassistent „Doubao“ steht bei den Downloads unter den AIGC-Anwendungen im Apple APP Store und in den wichtigsten Android-Anwendungsmärkten an erster Stelle. Derzeit öffnet Doubao Big Model seine Dienste über ByteDance für den Unternehmensmarkt und hat Kooperationen mit Smart-Terminal-Herstellern wie OPPO, Honor, Xiaomi, Samsung und Asus aufgebaut.

Das obige ist der detaillierte Inhalt vonZhiyuan aktualisiert die Rangliste der großen Modelle: Das große Doubao-Modell belegt in China den ersten Platz bei der „objektiven Bewertung'. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heißer Artikel

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vor By DDD

Repo: Wie man Teamkollegen wiederbelebt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

1 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Schwierigkeiten bei der Aktualisierung der Zwischenspeicherung offizieller Konto -Webseiten: Wie vermeiden Sie den alten Cache, der sich auf die Benutzererfahrung nach der Versionsaktualisierung auswirkt?

3 Wochen vor By 王林

Hot-Tools-Tags

Code und IT

Stimme

Geschäft

Marketing

AI Detektor

Chatbot

Design & Kunst

Heißer Artikel

Wie lange dauert es, um Split Fiction zu schlagen?

3 Wochen vor By DDD

Repo: Wie man Teamkollegen wiederbelebt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

1 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

3 Wochen vor By 王林

Heiße Artikel -Tags

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7281

Java-Tutorial

1622

CakePHP-Tutorial

1341

Laravel-Tutorial

1258

PHP-Tutorial

1205

Related knowledge

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden Aug 09, 2024 pm 04:01 PM

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen Sep 02, 2024 pm 01:56 PM

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann Aug 21, 2024 pm 07:33 PM

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt Aug 22, 2024 pm 10:35 PM

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren Sep 03, 2024 pm 05:18 PM

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht Aug 08, 2024 am 07:02 AM

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow Aug 19, 2024 pm 04:48 PM

Das erste große UI-Modell in China wird veröffentlicht! Das große Modell von Motiff ist der beste Assistent für Designer und optimiert den UI-Design-Workflow

See all articles