Peking ist Gastgeber der WAVE SUMMIT Deep Learning Developer Conference 2023, die vom National Engineering Research Center for Deep Learning Technology and Applications ausgerichtet wird
Wang Haifeng, Chief Technology Officer von Baidu und Direktor des National Engineering Research Center for Deep Learning Technology and Applications, sagte in seiner Grundsatzrede zum ersten Mal, dass groß angelegte Sprachmodelle über die grundlegenden Grundfunktionen künstlicher Intelligenz verfügen, einschließlich Verständnis , Generation, Logik und Gedächtnis und sind universelle künstliche Intelligenz. Intelligenz bringt neue Hoffnung
8 Millionen Entwickler nutzen Flying Paddle und es wurden mehr als 800.000 Modelle erstellt
Im April 2019 fand zum ersten Mal die WAVE SUMMIT Deep Learning Developer Conference statt. Auf der Konferenz betonte Wang Haifeng die Vielseitigkeit von Deep Learning und seine Merkmale der Standardisierung, Automatisierung und Modularität für die industrielle Massenproduktion, die künstliche Intelligenz in die Phase der industriellen Massenproduktion beförderten. Nach vier Jahren der Entwicklung hat der Fortschritt der Deep-Learning-Technologie und -Anwendungen diesen Standpunkt vollständig bestätigt. Die Deep-Learning-Technologie wird immer vielseitiger und die Standardisierung, Automatisierung und modularen Funktionen von Deep-Learning-Plattformen werden immer offensichtlicher. Gleichzeitig hat der Aufstieg vorab trainierter großer Modelle die Tiefe und Breite der Anwendungen künstlicher Intelligenz weiter erweitert. Daher kann man sagen, dass künstliche Intelligenz das Stadium der industriellen Massenproduktion erreicht hat
Im Hinblick auf die Standardisierung optimieren wir gemeinsam Frameworks und Modelle und passen sie einheitlich an unterschiedliche Hardware an, um das Anwendungsmodell prägnanter und effizienter zu gestalten und so die Hemmschwelle für Anwendungen der künstlichen Intelligenz deutlich zu senken. Im Hinblick auf die Automatisierung bieten wir umfassende Forschungs- und Entwicklungslösungen für künstliche Intelligenz, einschließlich Schulung, Anpassung und Inferenzbereitstellung zur Verbesserung der Effizienz. Im Hinblick auf die Modularität bieten wir eine umfangreiche Modellbibliothek auf industrieller Ebene, um die praktische Anwendung künstlicher Intelligenz in verschiedenen Szenarien zu unterstützen
FeiPaddles industrietaugliche Deep-Learning-Open-Source-Open-Plattform und Wenxins großes Modell fördern sich gegenseitig, lassen die FeiPaddle-Ökologie florieren, ziehen 8 Millionen Entwickler an, bieten Dienstleistungen für 220.000 Unternehmen und Institutionen an und entwickeln 800.000 Produkte basierend auf dem FeiPaddle-Modell. Wang Haifeng erklärte die tiefe Bedeutung des chinesischen Namens der Flying Paddle-Entwicklergemeinschaft AI Studio „Galaxy Community“: „Wenxin und Flying Paddle verschmelzen und segeln gemeinsam in die Galaxie.“ Durch die gemeinsame Förderung von Feipiao und Wenxin werden wir mit allen Entwicklern zusammenarbeiten, um die Galaxy-Community aufzubauen und die unendlichen Möglichkeiten der allgemeinen künstlichen Intelligenz zu erkunden
Groß angelegte Sprachmodelle bringen neue Hoffnung für allgemeine künstliche Intelligenz
Wang Haifeng glaubt, dass künstliche Intelligenz über eine Vielzahl typischer Fähigkeiten verfügt, zu denen zu den grundlegenden Grundfähigkeiten Verständnis, Erzeugung, Logik und Gedächtnis gehören. Je stärker diese vier Fähigkeiten sind, desto näher kommt die künstliche Intelligenz dem Niveau der allgemeinen künstlichen Intelligenz. Das große Sprachmodell verfügt über diese vier Fähigkeiten und gibt Hoffnung auf die Entwicklung allgemeiner künstlicher IntelligenzKonkret basieren die typischen Fähigkeiten der künstlichen Intelligenz wie Kreation, Programmierung, Problemlösung, Planung usw. auf grundlegenden Grundfähigkeiten wie Verständnis, Generierung, Logik, Gedächtnis usw., obwohl der Grad der Abhängigkeit unterschiedlich ist in unterschiedlichem Ausmaß. Nehmen Sie das Problemlösen als Beispiel: Vom Verstehen der Frage über das Lösen der Frage bis hin zum schließlichen Schreiben der Antwort müssen Sie Verständnis, Gedächtnis, Logik und generative Fähigkeiten umfassend einsetzen
Wie erlangt man diese Fähigkeiten? Am Beispiel von Wen Xinyiyan trainieren wir zunächst ein vorab trainiertes großes Modell durch Fusionslernen von Billionen Daten und Hunderten Milliarden Wissen. Anschließend verwenden wir Techniken wie überwachte Feinabstimmung, verstärkendes Lernen mit menschlichem Feedback und Eingabeaufforderungen, um die Modellleistung weiter zu verbessern. Darüber hinaus verfügen wir auch über technische Vorteile wie Wissenserweiterung, Abrufverbesserung und Dialogverbesserung
Optimieren Sie Datenquellen und Datenverteilung durch mehrere Strategien, erstellen Sie Basismodelle für die Langtextmodellierung, führen Sie überwachte Feinabstimmungen mit mehreren Typen und mehreren Stufen sowie adaptive überwachte Feinabstimmungen mit mehreren Aufgaben durch und implementieren Sie technologische Innovationen wie Multi -Level- und Multi-Granularitäts-Belohnungsmodelle verbessern grundlegende allgemeine Fähigkeiten umfassend. Im Hinblick auf verbessertes Abrufen und Wissen wird die Fähigkeit, Weltwissen zu beherrschen und anzuwenden, durch die Verbesserung von Wissenspunkten verbessert; logische Fähigkeiten werden durch groß angelegte logische Datenkonstruktion, logische Wissensmodellierung, multigranulare semantische Wissenskombination und symbolische neuronale Netze verbessert; durch den Aufbau eines umfassenden sicheren Daten-, Inhalts-, Modell- und Systemsicherheitssystems, um die Sicherheit großer Modelle zu gewährleisten
Durch die durchgängige adaptive Hybrid-Paralleltrainingstechnologie von Flying Paddle und die gemeinsame Optimierung von Komprimierung, Inferenz und Dienstbereitstellung wurde die Trainingsgeschwindigkeit des Wenxin-Großmodells um das Dreifache und die Inferenzgeschwindigkeit um mehr erhöht mehr als 30 Mal, wodurch die Effizienz verbessert wird
Durch datengesteuerte, schnelle Erstellung und Plug-in-erweiterte Anwendungen haben wir fünf Plug-ins eingeführt, darunter Wen Xin Yi Yan, Baidu Search, Browsing Documents, E Yan Yi Tu, Shuo Tu Jie Hua und Yijing Liuying. Diese Plug-ins ermöglichen es unserem Modell, in Echtzeit genaue Informationen, lange Textzusammenfassungen und Fragen und Antworten, Dateneinblicke und Diagrammerstellung, bildbasierte Erstellung und Fragen und Antworten sowie Vincent-Videos zu generieren. Durch den Plug-in-Mechanismus erweitern wir die Leistungsgrenzen großer Modelle, um sie besser an die Anforderungen verschiedener Szenarien anzupassen. Wang Haifeng sagte, dass wir in Zukunft mit Entwicklern zusammenarbeiten werden, um ein Plug-in-Ökosystem aufzubauen und die Ergebnisse technologischer Innovationen auszutauschen
Künstliche Intelligenz, repräsentiert durch große Sprachmodelle, dringt in Tausende von Branchen ein und beschleunigt die industrielle Modernisierung und das Wirtschaftswachstum. In diesem Prozess bilden technologische Innovation und Anwendungsimplementierung einen positiven Kreislauf. Fähigkeiten wie Verständnis, Generierung, Logik und Gedächtnis nehmen weiter zu. Die Breite und Tiefe industrieller Anwendungen bringt immer neue Hoffnung künstliche Intelligenz.
Das obige ist der detaillierte Inhalt vonWang Haifeng, CTO von Baidu: Die Zahl der Flying Paddle-Entwickler hat 8 Millionen erreicht, und große Sprachmodelle läuten den Beginn der allgemeinen künstlichen Intelligenz ein. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!