Am Nachmittag des 16. März hielt Baidu eine Pressekonferenz in seinem Hauptsitz in Peking ab. Das Thema drehte sich um die neue Generation großer Sprachmodelle und generative KI-ProdukteWenxinYiyan. Robin Li, Gründer, Vorsitzender und CEO von Baidu, und Wang Haifeng, Chief Technology Officer von Baidu, besuchten und demonstrierten die fünf Verwendungsszenarien von Wen Modale Generierung.
Der Live-Demonstration nach zu urteilen, hat Wen Xinyiyan die Fähigkeit, menschliche Absichten bis zu einem gewissen Grad zu verstehen, und die Genauigkeit, Logik und Geläufigkeit seiner Antworten nähert sich allmählich dem menschlichen Niveau. Robin Li hat jedoch auch oft erwähnt, dass diese Art von großen Sprachmodellen noch weit vom Entwicklungs- und Perfektionsstadium entfernt ist und noch viel Raum für Verbesserungen besteht. In Zukunft wird es sich definitiv schnell weiterentwickeln und sich mit jedem Durchgang ändern Tag.
Baidu kündigte auch den Einladungstestplan von Wen Xinyiyan an. Ab dem 16. März können die ersten Benutzer das Produkt auf der offiziellen Website von Wenxinyiyan testen, indem sie Testcodes einladen, und es wird in Zukunft für mehr Benutzer geöffnet. Darüber hinaus wird Baidu Smart Cloud in Kürze Wenxinyiyan-API-Schnittstellen-Aufrufdienste für Unternehmenskunden öffnen. Reservierungen werden offiziell am 16. März eröffnet. Suchen Sie nach „Baidu Smart Cloud“, um auf die offizielle Website zu gelangen, und Sie können sich für die Teilnahme am Wenxin Yiyan Cloud-Servicetest bewerben.
Derzeit stellen große Sprachmodelle und generative KI ein neues technologisches Paradigma dar und sind Chancen, die sich jedes Unternehmen auf der Welt nicht entgehen lassen darf. Baidu Wenxinyiyan ist als Empowerment-Plattform auf Basis künstlicher Intelligenz positioniert, die die intelligente Transformation Tausender Branchen wie Finanzen, Energie, Medien und Regierungsangelegenheiten unterstützen wird. Robin Li sagte: „Baidu hofft, mit allen zusammenzuarbeiten, um die Weiterentwicklung der Technologie der künstlichen Intelligenz voranzutreiben, damit jeder die fortschrittlichsten Produktivitätstools nutzen kann, damit jeder davon profitieren kann.“
Auf der Pressekonferenz zeigte Robin Li Die Worte von Wen
In der Szene des literarischen Schaffens fasste Wen Xinyiyan anhand von Dialogfragen den Kerninhalt des bekannten Science-Fiction-Romans „Das Drei-Körper-Problem“ zusammen und schlug fünf Ansatzpunkte für die Fortsetzung des Schreibens von „Das Drei-Körper-Problem“ vor ", Reflexion von Dialogfragen und -antworten, Umfassende Fähigkeit, Inhalte zusammenzufassen, zu analysieren und zu erstellen.
Darüber hinaus beantwortete Wen Xinyiyan treffend sachliche Fragen zum Autor von „Das Drei-Körper-Problem“ und zum Charakterdarsteller in der TV-Serie. Generative KI „erfindet“ bei der Beantwortung sachlicher Fragen oft „Dinge“, und Wen Xinyiyan führt Baidus wissenserweitertes Großmodellkonzept fort und verbessert die Genauigkeit sachlicher Fragen erheblich.
Im Szenario zur Erstellung von Geschäftstexten hat Wen Xinyiyan die kreativen Aufgaben erfolgreich abgeschlossen: Benennung des Unternehmensnamens, Verfassen eines Slogans und Verfassen einer Pressemitteilung.
In drei aufeinanderfolgenden Inhaltserstellungen konnte Wen Xinyiyan die menschlichen Absichten genau verstehen und sie klar ausdrücken. Dies ist die „Entstehung von Intelligenz“, die auf der Grundlage des riesigen Datenumfangs erfolgt. Die Trainingsdaten des großen Modells von Wenxin Yiyan umfassen Billionen Webseitendaten, Milliarden Suchdaten und Bilddaten, Dutzende Milliarden täglicher Sprachanrufdaten und einen Wissensgraphen mit 550 Milliarden Fakten.
Wen Xinyiyan verfügt außerdem über ein gewisses Maß an Denkfähigkeit und kann relativ komplexe Aufgaben wie mathematische Schlussfolgerungen und logisches Denken erlernen. Angesichts klassischer Fragen wie „Huhn und Kaninchen im selben Käfig“, die das logische Denken des Menschen trainieren, kann Wen Xinyiyan die Bedeutung der Frage verstehen und die richtigen Ideen zur Lösung des Problems haben und dann die richtigen Schritte zur Berechnung des Problems befolgen Schritt für Schritt wie ein Schüler.
Literaturschöpfung, Geschäftstexterstellung und mathematische Berechnung sind gemeinsame Vorteile und Fähigkeiten großer Sprachmodelle. Auf dieser Grundlage zeigt Wenxinyiyan auch ein besseres Chinesischverständnis und multimodale Generierungsfähigkeiten.
Bei der Vorführung vor Ort erklärte Wen Xinyiyan die Bedeutung der Redewendung „Luoyang-Papier ist teuer“ und der entsprechenden Wirtschaftstheorie „Luoyang-Papier ist teuer“ richtig und verfasste außerdem ein Akrostichon mit den vier Wörtern „Luoyang-Papier“. ist teuer“.
In Bezug auf die multimodale Generierung demonstrierte Robin Li die Fähigkeit von Wen Xin Yi Yan, Text, Bilder, Audio und Video zu generieren. Interessanterweise kann Wenxiniyan sogar Sprache in Dialekten wie dem Sichuan-Dialekt erzeugen. Die Videogenerierungsfunktion von Wenxiniyan steht aufgrund der hohen Kosten derzeit nicht allen Benutzern zur Verfügung und wird in Zukunft schrittweise zugänglich sein.
„Multimodalität ist ein klarer Entwicklungstrend der generativen KI.“ Robin Li sagte: „Da Baidus Fähigkeit, große multimodale Modelle zu vereinheitlichen, zunimmt, werden sich die multimodalen Generierungsfähigkeiten von Wen Xinyiyan weiter verbessern.“ Leistung, es hat die Fähigkeit, menschliche Absichten bis zu einem gewissen Grad zu verstehen, und die Genauigkeit, Logik und Geläufigkeit seiner Antworten nähert sich allmählich dem menschlichen Niveau. Aber insgesamt ist diese Art von großen Sprachmodellen noch lange nicht ausgereift und beruht auf einer schrittweisen Iteration durch echtes Benutzer-Feedback.
Wang Haifeng sagte, dass Wenxinyiyan ein wissensverbessertes großes Sprachmodell der neuen Generation ist, das auf der Grundlage der Modelle der ERNIE- und PLATO-Serie entwickelt wird. Zu den Schlüsseltechnologien gehören überwachte Feinabstimmung, verstärkendes Lernen mit menschlichem Feedback, Eingabeaufforderungen, Wissenserweiterung, Abrufverbesserung und Dialogverbesserung. Die ersten drei sind Technologien, die von solch großen Sprachmodellen verwendet werden und in ERNIE und PLATO angewendet und gestärkt wurden. Die letzten drei sind Technologien, bei denen Baidu bereits technische Vorteile bietet auch die Grundlage dafür, dass Wen Xinyiyan in Zukunft immer stärker wird.
Robin Li betonte: „Wen Xinyiyan wird ein Schwungrad zwischen echtem Benutzerfeedback, Entwickleraufrufen und Modelliterationen herstellen. Der Effekt wird sich schnell verbessern und Ihnen eine „Überraschung im Abstand von drei Tagen, Sie werden beeindruckt sein“ bereiten.“
Robin Li sagte, dass Baidu derzeit das erste Unternehmen unter den großen Unternehmen der Welt sei, das ein Benchmark-ChatGPT-Produkt herstelle. Robin Li wies darauf hin: „Egal um welches Unternehmen es sich handelt, es ist unmöglich, in ein paar Monaten ein so großes Sprachmodell aufzubauen. Deep Learning und die Verarbeitung natürlicher Sprache erfordern jahrelange Beharrlichkeit und Anhäufung und können nicht schnell durchgeführt werden.“Ja, Wen Xinyiyan ist eine Fortsetzung von Baidus Bemühungen der letzten Jahre. Mit dem Eintritt des Menschen in das Zeitalter der künstlichen Intelligenz hat sich der Technologie-Stack der IT-Technologie grundlegend verändert, von den letzten drei Schichten zu den vier Schichten „Chip-Framework-Modell-Anwendung“. Heute ist Baidu eines der wenigen Unternehmen für künstliche Intelligenz auf der Welt, das über ein Full-Stack-Layout in diesen vier Schichten verfügt, vom High-End-Chip-Kunlun-Kern über das Feipiao-Deep-Learning-Framework bis hin zu vorab trainierten großen Wenxin-Modellen und Suchfunktionen , Intelligente Cloud, Anwendungen wie autonomes Fahren und Xiaodu verfügen auf allen Ebenen über branchenführende selbst entwickelte Technologien. Robin Li glaubt, dass der Vorteil des Full-Stack-Layouts von Baidu AI darin besteht, dass eine durchgängige Optimierung in der vierschichtigen Architektur des Technologie-Stacks erreicht werden kann, was die Effizienz erheblich verbessert. Insbesondere besteht eine starke Synergie zwischen der Framework-Schicht und der Modellschicht, die dazu beitragen kann, effizientere Modelle zu erstellen und die Kosten erheblich zu senken. Tatsächlich stellen das Training und die Schlussfolgerung sehr umfangreicher Modelle eine große Herausforderung für das Deep-Learning-Framework dar. Um beispielsweise ein effizientes verteiltes Training von Hunderten Milliarden Parametermodellen zu unterstützen, hat Baidu Flying Paddle speziell die 4D-Hybrid-Paralleltechnologie entwickelt. Seit Baidu im Februar offiziell „Wen Xin Yi Yan“ angekündigt hat, haben mehr als 650 Unternehmen ihren Zugang zum Wen Xin Yi Yan-Ökosystem angekündigt. Robin Li prognostiziert, dass große Sprachmodelle drei große Branchenchancen mit sich bringen werden. Die erste Kategorie ist eine neue Art von Cloud-Computing-Unternehmen, deren Mainstream-Geschäftsmodell sich von IaaS zu MaaS geändert hat. Wen Xins Worte werden die Spielregeln in der Cloud-Computing-Branche grundlegend verändern. In der Vergangenheit wählten Unternehmen Cloud-Anbieter eher nach grundlegenden Cloud-Diensten wie Rechenleistung und Speicher. In Zukunft wird mehr davon abhängen, ob das Framework gut ist, ob das Modell gut ist und von der Zusammenarbeit zwischen den vier Schichten Modell, Framework, Chip und Anwendung. Wen Xinyiyan wird über die Baidu Intelligent Cloud Dienstleistungen für die Außenwelt bereitstellen, um Unternehmen beim Aufbau ihrer eigenen Modelle und Anwendungen zu unterstützen. Schlüsselbereiche wie Landwirtschaft, Industrie, Finanzen, Bildung, medizinische Versorgung, Transport und Energie werden die Effizienz erheblich verbessern wird in jeder Branche eingesetzt werden. Eine Branche bildet schnell einen neuen Industrieraum, um bei der Verwirklichung des digitalen China zu helfen. Robin Li gab bekannt, dass Baidu Smart Cloud in naher Zukunft eine Pressekonferenz abhalten wird, deren Thema sich auf die Cloud-Dienste und Anwendungsprodukte von Wen Xinyiyan konzentrieren wird, zu denen sowohl öffentliche Cloud-Dienste als auch privatisierte Bereitstellungen gehören. Die zweite Kategorie sind Unternehmen, die Branchenmodelle verfeinern. Dies ist die mittlere Ebene zwischen dem allgemeinen Großmodell und Unternehmen. Basierend auf ihren Einblicken in die Branche können sie die allgemeinen Großmodellfähigkeiten nutzen, um Branchenkunden Lösungen anzubieten. In diesem Zusammenhang hat Baidu Wenxin Model mehr als 10 Branchenmodelle in den Bereichen Strom, Finanzen, Medien und anderen Bereichen veröffentlicht. Die dritte Kategorie sind Unternehmen, die Anwendungen auf Basis großer Modellbasen entwickeln, also Anwendungsdienstleister. Robin Li behauptete, dass die wahre Chance für die meisten Unternehmer und Unternehmen nicht darin bestehe, grundlegende Großmodelle wie ChatGPT und Wenxinyiyan von Grund auf zu entwickeln. Dies sei sehr unrealistisch und unwirtschaftlich. Dies könnte die echte Chance sein, wichtige Anwendungsdienste auf der Grundlage eines allgemeinen großen Sprachmodells präventiv zu entwickeln. Derzeit sind auf der Grundlage von Textgenerierung, Bildgenerierung, Audiogenerierung, Videogenerierung, digitalen Menschen, 3D und anderen Szenarien viele unternehmerische Starunternehmen entstanden, die in Zukunft neue Giganten sein könnten. „Wir glauben, dass künstliche Intelligenz jede Branche, die wir heute haben, völlig verändern wird. Der langfristige Wert der KI und ihre disruptiven Veränderungen in allen Lebensbereichen haben gerade erst begonnen „Sobald neue Produkte auf den Markt kommen, werden weitere Meilensteine erreicht“, sagte Robin Li. (eine Orange)
Das obige ist der detaillierte Inhalt vonRobin Li: Die Schwelle für Wen Xinyiyans Benchmark ChatGPT ist sehr hoch, und Baidu ist das erste Unternehmen unter den großen Unternehmen der Welt, das dies schafft.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!