Derzeit sind groß angelegte Modelle führend bei der Transformation künstlicher Intelligenz von dedizierter zu allgemeiner Intelligenz und erobern die Welle der Intelligenz. Auf der World Artificial Intelligence Conference (WAIC) 2023 erregten große Modelle erneut die Aufmerksamkeit der Branche. Mehr als 30 große Modelle im In- und Ausland traten auf derselben Bühne an und es wurden gemeinsam Spitzentechnologien der globalen künstlichen Intelligenz vorgestellt.
Am 6. Juli gab Hu Guoping, Senior Vice President von iFlytek und Direktor des National Key Laboratory of Cognitive Intelligence, auf dem von Huawei veranstalteten Shengteng Artificial Intelligence Industry Summit Forum bekannt, dass iFlytek Spark mit Shengteng zusammenarbeiten wird Die KI-Allianz schafft eine neue universelle intelligente Basis in China.
„Inländische Großmodelle können nur dann eine große Zukunft haben, wenn die Rechenleistung auf Chinas unabhängiger Innovation basiert“, sagte Hu Guoping.
Hu Guoping ging auf dem Treffen am 15. Dezember 2022 auf die Entwicklungsgeschichte des großen kognitiven Modells „1+N“ ein. Am 6. Mai 2023 startete iFlytek Spark Cognitive Das große Modell wurde offiziell veröffentlicht und stellte sieben Kernfunktionen wie Textgenerierung, Sprachverständnis, Wissensfrage und -antwort sowie logisches Denken vor. Am 9. Juni wurde es erneut aktualisiert und das Spark Cognitive Large Model V1 veröffentlicht .5.
Hu Guoping, Senior Vice President von iFlytek und Direktor des National Key Laboratory of Cognitive Intelligence
In Bezug auf das Spark-Modell teilte Hu Guoping auch die Anwendung großer Modelle in den Bereichen Bildung, Büro, Automobil, Medizin, Industrie und anderen Bereichen mit. Basierend auf dem Innovationsschritt der Kerntechnologie hat das Spark-Modell in mehreren Branchen einen Vorsprung von 0 auf 1 erreicht Szenarien. Innovative Anwendungen.
Hinter der beschleunigten Iteration und dem Aufholen großer Modelle steckt eine Herausforderung bei der Rechenleistung, die nicht ignoriert werden kann. Derzeit ist die Forschung und Entwicklung großer Modelle jedoch stark von High-End-KI-Chips, -Clustern und -Ökosystemen abhängig. Hohe Rechenleistung, hohe Kommunikationsbandbreite und großer Videospeicher sind zur unverzichtbaren Rechenleistungsbasis für das Training großer Modelle geworden. Der Fortschritt einzelner KI-Chips hat mit der Nachfrage nach großer Rechenleistung für große Modelle nicht Schritt gehalten irreversibler Entwicklungstrend.
Nach Angaben von Huawei haben Ascend-KI-Cluster derzeit den Bau von Rechenzentren für künstliche Intelligenz in 25 Städten im ganzen Land unterstützt, und sieben dieser städtischen öffentlichen Rechenleistungsplattformen wurden in die erste Reihe nationaler „künstlicher Generationen“ ausgewählt Intelligenz, öffentliche Rechenleistung, offene Innovationsplattformen.“ Auf diesem Forum kündigte Huawei ein umfassendes Upgrade des Ascend AI-Clusters an. Die Clusterskala wurde vom ursprünglichen 4.000-Karten-Cluster auf 16.000 Karten erweitert. Es handelt sich um den branchenweit ersten 10.000-Karten-KI-Cluster mit schnellerer Trainingsgeschwindigkeit und einem stabilen Schulungszyklus von mehr als 30 Tagen der Branche zehnmal voraus.
Der Schlüssel zur Sicherheit und Entwicklung großer Modelle in unserem Land liegt in der schnellen Förderung des Ökosystems großer Modelle auf der Grundlage unabhängiger innovativer Hardware und Software. „Hu Guoping sagte, dass die Zusammenarbeit zwischen iFlytek Spark und Ascend AI die inländische Großmodellarchitektur auf der Grundlage unabhängiger innovativer Software und Hardware stärken wird.“ „Einerseits basiert das kognitive Großmodell iFlytek Spark auf dem integrierten Design von Training und Argumentation und erzielt technologische Durchbrüche bei der Spärlichkeit großer Modelle und der Quantifizierung mit geringer Präzision. Es kann sich effizient an Ascend AI anpassen und die industrielle Anwendung und Iteration beschleunigen andererseits werden mit Shengteng AI als Kern Software und Hardware gemeinsam optimiert, um einen großen Modelltrainingscluster mit konzentrierter Rechenleistung, überlegener Leistung, stabiler Versorgung und Datensicherheit aufzubauen.
Nach Ansicht von Hu Guoping ähneln große Modelle der Hauptschicht des Gehirns. Sie werden durch mehr als 100 Milliarden Neuronen kombiniert, empfangen Eingabestimulation und erzeugen dann intelligente Ausgabe. Sie verfügen über ähnliche intelligente Stimulations- und Betriebsmechanismen. „Was das Gehirn kann, können auch große Modelle erreichen. Dies zeigt, dass große Modelle über unbegrenztes Potenzial verfügen. In den vier Wellen hat die künstliche Intelligenz mit dem Aufkommen der Intelligenz die Ära der großen Modelle erlebt und könnte endlich die richtige Antwort finden.“ „Zukunftsaussichten zeigen die Zunahme des Datenvolumens, die Zunahme der Modellgröße, die Erhöhung der Anforderungen und die Komplexität der Aufgaben, wodurch die Nachfrage nach großer Rechenleistung für große Modelle weiter steigt. Wir hoffen, mit Shengteng AI zusammenzuarbeiten, um die historische Chance der allgemeinen künstlichen Intelligenz zu nutzen und unserem Land dabei zu helfen, einen neuen Eckpfeiler der allgemeinen Intelligenz zu schaffen. „Sagte Hu Guoping.
Das obige ist der detaillierte Inhalt vonAuf der World Artificial Intelligence Conference gab iFlytek eine Partnerschaft mit Huawei bekannt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!