Zhixixi berichtete am 24. März, dass heute der GTIC 2023 China AIGC Innovation Summit erfolgreich in Peking stattgefunden hat!
Gerade als die GPT-4-Ära eröffnet wurde, ist dieser Gipfel mit dem Thema „Eine neue Ära der KI schafft eine neue Welt“ der erste hochkarätige Innovationsgipfel in China, der sich auf generative KI (AIGC) konzentriert und zusammenbringt Super-20-Führungskräfte aus Industrie, Wissenschaft und Forschung starteten Runden heftiger technischer Konfrontationen und Meinungskollisionen, um jedem Industriemenschen, der im Nebel voranschreitet, zu helfen, seine Reise zur Eliminierung von Unwahrheiten und zur Suche nach der Wahrheit abzuschließen.
Zu viele Fragen haben uns in den letzten zwei Monaten durch den Kopf geschossen: Wird GPT-4 wirklich zu einer Explosion der kognitiven Intelligenz führen? Was ist der Unterschied zwischen unserer KI und ChatGPT? Wird eine chinesische Version von OpenAI geboren? Wird MaaS (Model as a Service), das von großen Herstellern häufig genannt wird, ein klarer Trend sein? Wird Chinas AIGC-Industrie eine „große Fabrik, die alles gewinnt“ oder eine „Hundert-Blumen-Blüte“ sein? Viele Fragen wurden auf diesem Gipfel beantwortet. Die meisten Antworten weichen von unserer gedankenlosen Intuition ab, und selbst die Meinungen unter Experten sind völlig unterschiedlich Gegenteil. Das macht diese Diskussionen äußerst wertvoll.
Vom Wettbewerb zwischen großen Herstellern und großen Modellprodukten bis zur Kollision der Top-KI-Investmentmeinungen, vom bahnbrechenden Produkttest von AIGC bis zur „gewalttätigen Ästhetik“ von Rechenleistungsunternehmen, von der Debatte „großes Modell gegen kleines Modell“ bis hin zu „Warum stand ChatGPT nicht an erster Stelle?“ Die Frage nach der Seele von „Appearing in China“ ... Welle für Welle von Höhepunkten, der Gipfel war voller Sitze, äußerst beliebt und die Atmosphäre des Austauschs war mehr als Den ganzen Tag über nahmen tausend Menschen an dem Treffen teil, und die Zahl der Live-Übertragungen im gesamten Netzwerk betrug bis zu 4,2 Millionen.
Gong Lunchang, Mitbegründer und CEO von Zhiyi Technology, sagte auf dem Gipfel im Namen des Veranstalters, dass die KI-Branche eine neue Phase der Marktchancen einleitet und der China AIGC Innovation Summit hofft, sie aufzubauen eine Austauschplattform für Wissenschaft, Industrie und Investitionskreise. Dieser Gipfel umfasst hauptsächlich ein Hauptforum des AIGC Summit Forum und drei thematische Foren für große Modelle, China-ähnliches ChatGPT und AIGC-Anwendungsinnovation.
Bei dem Treffen nahmen Vertreter akademischer Institutionen wie der Chinesischen Akademie der Wissenschaften, Branchenriesen wie Microsoft, Baidu, Kuaishou, Nvidia, Kunlun Wanwei und SenseTime, Lanzhou Technology, Moxin Artificial Intelligence, UBTECH, Zhipu AI und Luchen teil Technologie-Unternehmerpioniere wie , Yunzhisheng, Zhujian Intelligence, aiXcoder, Movie Book Technology und Computational Aesthetics (Nolibox) sowie Gastvertreter von Investmentinstitutionen wie Qiming Venture Capital, Creation Partners Capital und Lanchi Venture Capital stellten große Modelle vor und Spitzeninnovationen, Geschäftsaussichten, Entwicklung der Rechenleistung, unternehmerische Möglichkeiten und Investitionsstrategien generativer KI.
Das Folgende ist der Kern der heutigen AIGC-Gipfelrede.
Gong Lunchang, Mitbegründer und CEO von Zhiyi Technology, hielt am im Namen des Veranstalters. Die Entstehung und Weiterentwicklung wichtiger Algorithmen und Modelle wie vorab trainierter Sprachmodelle und Diffusionsmodelle haben die schnelle Entwicklung generativer KI gefördert, und verwandte Produkte haben in sehr kurzer Zeit weltweite Aufmerksamkeit erregt.
▲Gong Lunchang, Mitbegründer und CEO von Zhiyi Technology
Die vergangene Woche war eine entscheidende Zeit für die rasante Weiterentwicklung von KI und Wen Xinyiyan sowie die Integration von GPT in Microsoft Der Eimer der Bürofamilie hat den Produktionswerkzeugsprung vorangetrieben. Die KI-Branche läutet eine neue Phase voller Marktchancen ein.
Auf dieser Grundlage möchte der China AIGC Innovation Summit eine Kommunikationsplattform für Wissenschaft, Industrie und Investitionskreise aufbauen, damit sich alle intensiv austauschen, Ideen anregen und die Umsetzung von Zusammenarbeit und Innovation fördern können.
Dieses Jahr ist das siebte Jahr seit der Gründung von Zhiyi Technology. Zhiyi Technology hält am Doppelantrieb von Technologie und Industrie fest, konzentriert sich auf Spitzentechnologien, die durch Digitalisierung und Intelligenz repräsentiert werden, sowie deren Branchenanwendungen und baut zwei große Geschäftssysteme für industrielle Medien und Unternehmensdienstleistungen auf.
Zhiyi Technology verfügt über eine Industriemedienmatrix, die durch Zhixi East, Core Dongxi und Car Dongxi repräsentiert wird. Es hat sich zu einem Industriemedium mit einzigartiger Positionierung und hohem Einfluss und Glaubwürdigkeit in China entwickelt und ist gleichzeitig eine Reaktion auf die Bedürfnisse der industriellen Modernisierung , hat es einen offenen Kurs entwickelt, der auf Zhiyi basiert. Als zentrales Unternehmensdienstleistungssystem arbeiten wir mit Experten und Wissenschaftlern von herausragenden Industrieunternehmen und Top-Universitäten auf der ganzen Welt zusammen, um eine Reihe von Vorträgen und neuen Jugendvorlesungen zu halten und kooperieren mit führenden inländischen und Ausländische Unternehmen organisieren maßgeschneiderte offene Kurse. Bisher wurden mehr als 600 Kurse abgeschlossen.
Zhou Ming, Gründer und CEO von Lanzhou Technology und stellvertretender Vorsitzender der CCF, China Computer Federation Zhang Jiajun, Forscher und Doktorvater am Institut für Automatisierung der Chinesischen Akademie der Wissenschaften, erklärte, wie große Modelle ein neues Paradigma bringen, erklärte, wie das Zidong Taichu-Modell die Geheimnisse der Welt versteht.
Gleichzeitig führte Xu Mingqiang, Chief Technology Officer der Microsoft Omni-Channel Division, alle dazu, AIGC-Trends und die Anwendung von Microsoft Azure OpenAI-Diensten in Unternehmen zu erkunden; Baidu Group Vice President Yuan Foyu, der gerade Wen Xin gegründet hatte Yi Yan kam vor Ort, um mit Wen Xin Yi Yan zu diskutieren, wie man die Spielregeln auf dem Cloud-Computing-Markt ändern kann.
1. Zhou Ming von Lanzhou Technology: Große Modelle bewirken den Aufstieg der kognitiven Intelligenz, und neun Hauptaspekte stehen im Mittelpunkt
Zhou Ming, Gründer und CEO von Lanzhou Technology, stellvertretender Vorsitzender von CCF, China Computer Federation, und Chefwissenschaftler von Innovation Works, gab eine ausführliche Interpretation des neuen Paradigmas, das große Modelle mit sich brachten.
▲Zhou Ming, Gründer und CEO von Lanzhou Technology, stellvertretender Vorsitzender von CCF, China Computer Federation und Chefwissenschaftler von Innovation Works
Als technischer Experte, der von Microsoft kam, sagte Zhou Ming, dass er tief davon überzeugt sei Beeinflusst durch Microsoft-Mitbegründer Bill Gates, glaubt er, dass große Modelle den Aufstieg der kognitiven Intelligenz bewirken. Große Modelle, insbesondere ChatGPT, stellen ein praktisches Zeitalter für Sprachverständnis, mehrstufigen Dialog und Problemlösung dar. Gleichzeitig lösen große Modelle effektiv das Problem der NLP-Aufgabenfragmentierung und verbessern die Forschungs- und Entwicklungseffizienz erheblich, was den Einstieg von NLP in die Industrie markiert Umsetzungsphase.
Derzeit durchläuft die KI die Ära 2.0, von spezialisierten Modellen für eine einzelne Aufgabe über allgemeine Modelle für ein breites Aufgabenspektrum bis hin zur AGI-Ära der allgemeinen künstlichen Intelligenz. Die KI 2.0-Ära wird zunächst Innovationen für kreative Inhalte, Büromethoden, Suchmaschinen, Mensch-Computer-Interaktionsschnittstellen, Finanzen und andere Bereiche hervorbringen.
Lanzhou Technology wurde im Juni 2021 gegründet und hat eine Reihe externer Produkte und Dienstleistungen für große Modelle auf den Markt gebracht. Derzeit wurden verschiedene Technologien und Produkte implementiert, darunter das große Modell Mencius, die AIGC-Plattform (Intelligent Creation) und die Plattform für maschinelle Übersetzung Finanz-NLP-Plattform, landete bei Unternehmen wie Flush und China Asset Management. In Kombination mit der ChatGPT-ähnlichen Technologie hat Lanzhou Technology den Konversationsroboter MChat auf den Markt gebracht, der Benutzern durch intelligenten Dialog dabei helfen kann, eine Vielzahl von Aufgaben in bestimmten Szenarien zu erledigen.
Zhou Ming sprach über die zukünftige Ausrichtung der Branche und sagte offen, dass es der aktuellen ChatGPT-ähnlichen Technologie immer noch an Argumentation, Logik, Mathematik und Arithmetik, sachlichen Fehlern usw. mangelt. In Zukunft verdienen neun Hauptthemen im Zusammenhang mit großen Modellen besondere Aufmerksamkeit, darunter Aspekte wie Argumentationsfähigkeit, sachliche Korrektheit und chinesische Verarbeitungsfähigkeiten.
2. Microsoft Xu Mingqiang: Zusammenarbeit mit OpenAI zum Bau eines Supercomputers
Die Modellparameter zeigen einen exponentiellen Wachstumstrend. Heutzutage werden die Zweifel an großen Modellen in nur 1-2 Jahren durch neue Zweifel ersetzt. Daher ist Xu Mingqiang, Chief Technology Officer der Omni-Channel-Abteilung von Microsoft, fest davon überzeugt, dass das Modell weiterhin schnell wachsen wird, da derzeit nur 1/10 des aktuellen hochwertigen Korpus verwendet wird.
▲Xu Mingqiang, Chief Technology Officer der Microsoft Omni-Channel Division
All dies ist untrennbar mit der Unterstützung leistungsstarker Rechenleistung verbunden, die auch die Größe und Parameter des trainierbaren Modells bestimmt. Daher hat Microsoft Azure mit OpenAI zusammengearbeitet, um einen KI-Supercomputer zu bauen, der für groß angelegte KI-Schulungen konzipiert ist. Der Computer verfügt über 285.000 CPUs und 10.000 GPUs.
Xu Mingqiang verglich das große Sprachmodell mit einem Schwamm Wikipedia, medizinische oder wissenschaftliche Arbeiten sind Wasser, und das Einstecken dieser Papiere wird zur Entstehung seiner Fähigkeiten führen.
Endlich entschieden wir uns für Unternehmensanwendungen. Das Problem, über das Unternehmen bei der Anwendung nachdachten, bestand darin, wie man Geschäftsprobleme durch Compiler in Computerprobleme umwandelt Geschäftsprobleme werden in Computerprobleme aus allen Lebensbereichen umgewandelt. Das Problem wird in ein Problem der Inhaltsverarbeitung umgewandelt.
ChatGPT-Anwendungsszenarien auf Unternehmensebene umfassen Kundenservice, Absatzmarkt, Inhaltsgenerierung, Wissensmanagement, unterstützte Entscheidungsfindung usw.
3. Zhang Jiajun, Chinesische Akademie der Wissenschaften: Das multimodale große Modell enthüllt das Geheimnis von „Purple East Taichu“ und erscheint „multispezialisiert und multifunktional“
Bei dem Treffen, Forscher Zhang Jiajun, Vizepräsident des Instituts für Automatisierung der Chinesischen Akademie der Wissenschaften und des Wuhan-Instituts für Künstliche Intelligenz, erklärte, wie das große Modell „Zidong Taichu“ die technischen Geheimnisse der Welt versteht.
▲Zhang Jiajun, Forscher und Doktorvater am Institut für Automatisierung der Chinesischen Akademie der Wissenschaften und stellvertretender Direktor des Wuhan Institute of Artificial Intelligence
Zhang Jiajun sagte, dass die Wirkung von Deep Learning große Modelle vorab trainiert verbessert sich weiter. Gegenwärtig beginnen multimodale große Modelle durch die Methode „Big Data + Big Model“ unter selbstüberwachten Lernbedingungen „multispezialisiert und multifunktional“ zu erscheinen und machen schnelle Fortschritte beim Lernen kleiner Stichproben und bei Fragen zur natürlichen Sprache Beantwortung, modalübergreifende Generierung und andere Aspekte. Große Modelle haben eine Innovationswelle vorangetrieben, aber ihr Energieverbrauch und ihre Kosten sind extrem hoch und ihre kognitiven Fähigkeiten liegen immer noch weit hinter denen des Menschen zurück.
„Zidong Taichu“ ist das weltweit erste multimodale Großmodell mit 100 Milliarden Parametern, das vom Team des Instituts für Automatisierung der Chinesischen Akademie der Wissenschaften ins Leben gerufen wurde. Zhang Jiajun sagte, dass dieses Modell das selbstüberwachte Multitasking-Lernen auf Token-, Modalitäts- und Stichprobenebene unterstützt und dabei 128 Tage lang auf 512 Karten trainiert und gleichzeitig eine einheitliche Modellierung des Modalverständnisses und der Modalgenerierung erreicht . „Zidong Taichu“ unterstützt modalübergreifende Abruf- und Generierungsbeispiele wie die Suche nach Bildern mit Text, die Generierung von Tönen mit Bildern und die Generierung von Bildern mit Tönen. Wenn Sie beispielsweise ein echtes Bild eingeben, kann Zidong Taichu ein personalisiertes 3D-Bild generieren.
Derzeit hat das Team die Zidong Taichu Open Service Platform 1.0 und die intelligente Generierungsplattform Zidong Taichu·Luoshen 1.0 AIGC eingeführt und Ressourcen aus Industrie, Wissenschaft und Forschung integriert, um ein offenes Open-Source-Ökosystem für künstliche Intelligenz aufzubauen und den Weg zur Industrialisierung zu erkunden allgemeine künstliche Intelligenz.
4. Baidu Yuan Foyu: Wen Xins Worte werden die Spielregeln auf dem Cloud-Computing-Markt ändern
Die globale KI-Industrie ist in eine explosive Phase eingetreten eine völlig neue Welt erschaffen. Im Jahr 2021 sagte Robin Li, CEO von Baidu, einmal: „Wenn ein Computer in der Lage ist, die natürliche Sprache des Menschen zu verstehen, über klare Ausdrucksfähigkeiten und gute logische Denkfähigkeiten verfügt, wird er einem Menschen sehr ähnlich sein. Und das Gedächtnis und die Rechenleistung von.“ Die Maschine ist weitaus besser als der Mensch. Daher wird KI heute definitiv jede Branche revolutionieren Unterstützung ist natürliches Sprachverständnis.
Yuan Foyu, Vizepräsident der Baidu Group, betonte: „Unter den größten Herstellern der Welt war Baidu der erste, der es veröffentlicht hat. Microsoft hat Open AI direkt angerufen und Google hat den Test am 21. März eröffnet. Meta und Amazon haben es nicht wirklich veröffentlicht.“ die gleiche Art von Produkten.
Wen Xinyiyan verfügt über fünf Kernkompetenzen, nämlich literarisches Schaffen, Erstellen von Geschäftstexten, mathematische Logikberechnung, chinesisches Verständnis und multimodale Generierung. Es kann weiterhin schreiben.“ „The Three-Body Problem“ und „A Dream of Red Mansions“; Live-Übertragungskopie erstellen; Fehler in mathematischen Problemen aufzeigen und den Lösungsprozess angeben; ausgeprägte Fähigkeit, die chinesische Sprache zu verstehen; multimodale Generierungsfähigkeit zur Generierung von Bildern und Audio und Video basierend auf Baidus selbstentwickeltem großem Sprachmodell. Yuan Foyu sagte, dass er, gemessen an der Leistung von Wenxin Yiyan, die Fähigkeit besitzt, menschliche Absichten zu verstehen, und dass sich die Genauigkeit, Logik und Geläufigkeit seiner Antworten allmählich dem menschlichen Niveau nähern. Eine Woche nach der Pressekonferenz von Wen Xinyiyan haben sich mehr als 100.000 Unternehmen für den API-Call-Service-Test von Wenxinyiyan beworben.Im Zeitalter der künstlichen Intelligenz verfügt der IT-Technologie-Stack über eine vierschichtige Architektur: Anwendungsschicht, Modellschicht, Framework-Schicht und Chipschicht. Yuan Foyu sagte: „Weltweit ist Baidu das einzige Unternehmen mit führenden Produkten in diesen vier Schichten.“ Anwendungsentwicklung. Kommen Sie zu drei großen Branchenmöglichkeiten.
3. Wird China eine OpenAI produzieren? Investoren: Da bin ich anderer Meinung!
Übung bringt wahres Wissen. Bei dem Treffen berichtete Zhang Fuzheng, Leiter des Kuaishou MMU Natural Language Processing Center & Audio Center, über Kuaishous Erkundung und Anwendung in AIGC, indem er die neuesten Fälle der KI-Generierung digitaler Menschen, Musik und Videos demonstrierte.
▲Zhang Fuzheng, Leiter des Kuaishou MMU Natural Language Processing Center & Audio Center
Zhang Fuzheng sprach zum ersten Mal darüber Die Perspektive des Workflows Das Verständnis von AIGC basiert auf dem Ausgangspunkt des Workflows: „Ersteller geben die Ideen ein, die sie ausdrücken möchten, synthetisieren den Inhalt durch KI-Technologie und geben ihn aus.“ Infrastruktur, KI-Atomfähigkeiten, AIGC-Lösungen und Landungsszenarien.
Im digitalen Humanszenario können Benutzer durch einfache Texteingabe innerhalb von 5 Minuten digitale Humananwendungen mit präzisen Mundformen und reichhaltigen Ausdrücken/Aktionen generieren. Sie können für E-Commerce, Personalbeschaffung und Anker verwendet werden , Training und andere Szenarien.
Im Hinblick auf intelligente Musik können Benutzer Texte und spezifische Melodien generieren, die sich auf die Themenwörter reimen und auf der Grundlage der Benutzereingabe bestimmter Themenwörter und anderer Informationen wie KI-Sänger basieren nah am Gesangsniveau echter Menschen.
Auch im Hinblick auf die Videoproduktion ist die AIGC-Technologie für YouTuber eine große Hilfe. Beispielsweise übersteigt der durchschnittliche Konsum von Kuaishous Video-Erstellung „One-Click-Film“ 450 Millionen, und der durchschnittliche tägliche Konsum von kopierten Filmen übersteigt 40 Millionen.
2. Wang Wei von Moxin Artificial Intelligence: Sparse Computing wird zur optimalen Lösung für die groß angelegte Modellimplementierung, Moxin führt die Entwicklung der KI 2.0-Rechenleistung an#🎜🎜 ##🎜🎜 #Auf der Nachfrageseite hat die Entwicklung der digitalen Zivilisation grundlegende Veränderungen erfahren. Generative KI öffnet die Tür für die Entwicklung äußerst erfolgreicher Anwendungen, und der Bedarf an Rechenleistung im Zeitalter der großen KI 2.0-Modelle wurde völlig untergraben. Im Vergleich zur KI 1.0-Ära kleiner Modelle, die sich auf die Vielseitigkeit der Rechenleistung konzentrierten, weisen große vorab trainierte Modelle einheitliche Strukturen auf und konzentrieren sich stärker auf Skalierbarkeit. Das Wachstum der Rechenleistung und der Inferenzgeschwindigkeit ist zu einem Problem bei der Entwicklung und Anwendung großer Modelle geworden. Wang Wei, Gründer und CEO von Moxin Artificial Intelligence, sagte: „Es ist schwierig, das exponentielle Wachstum der Rechenleistung allein durch Hardware zu bewältigen. Es muss durch Software und Hardware integriert werden. In diese Richtung Sparse Computing gilt als die Richtung mit dem größten Entwicklungs- und Implementierungspotenzial. „Im Vergleich zu Dense Computing kann Sparse Computing eine Leistungsverbesserung von 1-2 Größenordnungen erzielen.“
▲Gründer und CEO von Ink Core Artificial Intelligence, Wang WeiAnfang 2021 die erste hohe Sparsity-Rate von Ink Core Der KI-Rechenchip Antoum wurde erfolgreich auf den Markt gebracht, und Moxin brachte anschließend die Antoum-basierten KI-Rechenkartenserien S4, S10 und S30 auf den Markt, um verschiedene KI-Anwendungsszenarien zu unterstützen. Basierend auf dem einzigartigen Dual-Sparse-Algorithmus und dem Software-Hardware-Kollaborationskonzept von Moxin können die Produkte von Moxin sowohl eine hohe Leistung als auch einen geringen Stromverbrauch erzielen, und der Dual-Sparse-Algorithmus kann in vielen Netzwerken und Anwendungen eine bis zu 32-fache Sparsity erreichen.
Durch tatsächliche Messungen am 176B Open-Source-Großmodell BLOOM kann die Ink Core S30-Rechenkarte eine Generierungsgeschwindigkeit von 25 Token/Sekunde erreichen, wenn nur mittlere und niedrige Sparsity-Raten verwendet werden, und kann eine Generation erreichen Geschwindigkeit von 4 Die Generierungsgeschwindigkeit von Zhang S30 übertrifft die von 8 A100, was die Inferenzgeschwindigkeit erheblich beschleunigt.
Wang Wei sagte: „Die rasante Entwicklung großer Modelle hat KI-Chip-Startups die Möglichkeit gegeben, riesige Player herauszufordern, und hat eine neue Display-Stufe eröffnet, indem sie bahnbrechende Innovationen nutzt, um bahnbrechende Leistungsdurchbrüche zu erzielen
3.“ Qiming Venture Partners Zhou Zhifeng: Fast 60 % der generativen KI-Unternehmer konzentrieren sich auf multimodale Anwendungen, und das chinesische Ökosystem könnte weitere Möglichkeiten schaffen Die Entwicklung der KI-Technologie erfolgt exponentiell. Wie lassen sich Trends vorhersagen und an neuen Knotenpunkten vorausplanen? Zhou Zhifeng, Partner bei Qiming Venture Partners, sagte, dass diese KI-Welle, die von extrem großen Pre-Training-Modellen angetrieben wird, transformative Generalisierungsfähigkeiten und Emergenzphänomene aus der zugrunde liegenden Technologie gezeigt und die Schwierigkeiten bis zu einem gewissen Grad gelöst hat Im Zeitalter der KI 1.0 gibt es für das Unternehmertum nur wenige Probleme, darunter die Tatsache, dass die KI-Technologie nur zu einem kleinen Teil in den Endprodukten verborgen ist, es der Gesellschaft an angemessenen Erwartungen an die KI-Technologie mangelt und es an einer vollständigen Infrastruktur und Umgebung für die Anwendungsentwicklung mangelt , der Mangel an börsennotierten Unternehmen und Kapitalmarktbewertungssystemen usw. KI ist wieder einmal zu einem Hotspot für Unternehmertum und Investitionen geworden. Innerhalb von zwei Jahren nach der Veröffentlichung von GPT-3 im Jahr 2020 haben sich die Investitionen globaler Risikokapitalinstitute in KI-Unternehmen vervierfacht, wobei allein im Jahr 2022 1,37 Milliarden US-Dollar an Finanzierungen bereitgestellt wurden.
▲ Qiming Venture Partners-Partner Zhou Zhifengunterscheidet sich vom Gründer von Baidu, der sagte, dass „China im Grunde nie wieder OpenAI haben wird“. Zhou Zhifeng glaubt, dass China und die Vereinigten Staaten im Großen und Ganzen sehr unterschiedliche ökologische Umgebungen haben KI-Basismodelle: China bietet viele einzigartige Möglichkeiten. Neben groß angelegten Modellrichtungen mit hohen technischen Barrieren, hoher Talentdichte und hohem Kapitalbedarf haben junge Unternehmer, Veteranen der vertikalen Industrie und Giganten der KI-Branche alle unterschiedliche unternehmerische Möglichkeiten in mehreren Technologie- und Anwendungsdimensionen. Das Technologieteam von Qiming Venture Capital hat eine „Karte“ der neuen Welle der ökologischen KI-Architektur und der wichtigsten Layoutbereiche zusammengefasst, von der Anwendung intelligenter Computerplattformen über Werkzeugketten, große Open-/Closed-Source-Modelle bis hin zu selbstgebauten Modellen/Dritten -Parteimodellbau usw. Kommen Sie als Referenz zu Risikokapital.
Laut der Kommunikationsstatistik des Technologieteams von Qiming Venture Capital mit mehr als 100 nach 2020 gegründeten Unternehmen konzentrieren sich im Bereich des generativen KI-Unternehmertums 14 % der Unternehmer auf die zugrunde liegende Technologie und 57 % auf multimodale Anwendungen, 29 % davon Unternehmer konzentrieren sich eher auf Sprachanwendungen, die ihre eigenen Barrieren in der KI-Technologie aufbauen können, und auf anwendungsorientierte Startups, die sich in industrielle Arbeitsabläufe integrieren lassen und einen hohen kommerziellen Wert bieten.
4. Roundtable-Dialog: Wird ChatGPT die technologische Revolution auslösen, „Der Gewinner nimmt alles“ oder „Hundert Blumen blühen lassen“?
Wie löst das wütende ChatGPT eine neue Runde der technologischen Revolution aus? Im morgendlichen Rundtischgespräch diskutierte Zhang Guoren, Mitbegründer und Chefredakteur von Zhiyi Technology, mit Sun Bin, Präsident und COO von Zhujian Intelligence, Huang Dongyan, einem Sprachtechnologie-Wissenschaftler von UBTECH, und Liang Yu, einem Partner von Creation Partners Capital, über Technologie, Industrie und Investitionen. Die brisanten Fragen brachten die Atmosphäre der Szene auf den Höhepunkt.
▲Round-Table-Dialogsitzung, von links nach rechts: Zhang Guoren, Mitbegründer und Chefredakteur von Zhiyi Technology, Sun Bin, Präsident und COO von Zhujian Intelligence, Huang Dongyan, Sprachtechnologiewissenschaftler von UBTECH , Liang Liang, Partner von Creation Partners Capital YuChatGPT wurde geboren und von NVIDIA-CEO Jen-Hsun Huang als „der iPhone-Moment der künstlichen Intelligenz“ gelobt, der sich auf die Implementierung konzentriert Der Leiter der Branche für das Verstehen natürlicher Sprache sagte mit Emotionen, dass die Beliebtheit dieses Produkts in der Tat auf ihre unerwartete Ursache zurückzuführen sei. Der neue Paradigmenwechsel, der durch große Modelle und gewalttätige Parameter hervorgerufen wurde, ist zu einem Anfang geworden.
UBTECH ist ein führender Akteur bei der Bereitstellung künstlicher Intelligenz für die Wartung von Robotern. „Das Aufkommen von GPT hat es uns ermöglicht, das Zeitalter der künstlichen Intelligenz in alle Lebensbereiche vorzudringen und Serviceroboter in Tausende von Haushalten vorzudringen“, sagte Huang Dongyan, ein Wissenschaftler für Sprachtechnologie bei UBTECH.
▲Huang Dongyan, ein Sprachtechnologiewissenschaftler von UBTECHYann LeCun, einer der drei Giganten des Deep Learning, sagte einmal, dass ChatGPT keine besondere Innovation aufweist, sondern einfach gut kombiniert ist. Liang Yu, ein Partner bei Creation Partners Capital, der sich auf Investitionen in Technologieunternehmen im Frühstadium konzentriert, äußerte ebenfalls eine ähnliche Ansicht. Er ist der Ansicht, dass sich die Systemintegration und das Engineering der Transformer-Architektur stetig weiterentwickelt haben, und ChatGPT hat keinen revolutionären Durchbruch geschafft. Huang Dongyan stimmte dem Standpunkt von Liang Yu zu und fügte hinzu, dass OpenAI das „von Gott gegebene Geheimnis“ im Prozess der Integration und des Versuchs und Irrtums entdeckt habe, was es dem Dialog ermöglicht habe, eine beeindruckende menschenähnliche Leistung zu erzielen.
Anschließend stellte Zhang Guoren eine Frage, die viel Aufmerksamkeit erregte: Die Einführung von GPT-4 von OpenAI und die aufeinanderfolgenden Veröffentlichungen von Microsoft-bezogenen Produkten haben die Konkurrenz stark unter Druck gesetzt Kombination soll beibehalten werden?
In dieser Hinsicht ist Sun Bin der Ansicht, dass jede Kombination von Leistungswerkzeugen davon abhängt, wie Menschen sie nutzen und anwenden. Letztendlich muss der Output der Menschen als Kriterium herangezogen werden. Der langfristige Wert ihrer Kombination liegt darin, ob sie in Zukunft auch in anderen Branchen eingesetzt werden kann, sodass Technologie und Industrie perfekt vereint werden können. Huang Dongyan sagte, wie weit die Kombination von Microsoft und OpenAI gehen könne, hänge von ihren technologischen Innovationsfähigkeiten und der iterativen Entwicklungsgeschwindigkeit ab. Natürlich werde es dabei auch eine große Anzahl von KI-Unternehmen geben, die mit „dark horse“-Technologien auftauchen könnten .
▲Sun Bin, Präsident und COO von Zhujian Intelligence
Generell gesehen gibt der Ansatz von Microsoft tatsächlich ein Muster für die Entwicklung dieser Branche vor. Liang Yu sagte: „Microsoft verfolgt bis zu einem gewissen Grad eine ökologische Strategie.“ Industrieanwendungen und Benutzerzugriff auf das Ökosystem können ein „Datenschwungrad“ bilden, und seine Rollgeschwindigkeit wird immer schneller.
Im häuslichen Umfeld erfordert die Ausbildung großer Modelle auch einen guten Korpus zum Erlernen der chinesischen Sprache, um als „Schwungrad“ ins Rollen zu kommen.
Von Meituan-Mitbegründer Wang Huiwen über Sogou-Gründer Wang Xiaochuan bis hin zu Kai-fu Lee, der den Project AI 2.0-Plan ankündigt, schließen sich viele große Namen der AIGC-Unternehmerwelle an. Als Leslie Cheung fragte, ob diese Welle des Unternehmertums ein „Winner-takes-all“-Trend wie das Unternehmertum im Internet-Zeitalter oder ein „Lasst hundert Blumen blühen“-Trend sein würde, stimmten mehrere Gäste Letzterem zu.
Sun Bin sagte, dass sich die Situation im Zeitalter der großen Modelle von der Ära der „großen Subventionen“ im Internet unterscheidet. Das neue große Sprachmodell bringt jedoch neue zugrunde liegende Motoren mit sich Die angesammelte industrielle Ökologie und Modelle werden wiederverwendet, um die Funktion fortzusetzen, hundert Blumen blühen zu lassen. Er räumte ein, dass große Sprachmodelle möglicherweise immer noch von großen Herstellern in der Branche dominiert werden, wichtige Durchbrüche jedoch weiterhin von wissenschaftlichen und technologischen Innovationsunternehmen abhängen.
Liang Yu stimmt dieser Ansicht ebenfalls zu. Er glaubt, dass große Hersteller zwar eine Vorreiterrolle spielen, Chancen für Start-up-Unternehmen jedoch in der Anwendungsebene liegen könnten, indem sie in vertikale Bereiche vordringen, um die industrielle Umsetzung umzusetzen, Kosten zu senken und die Effizienz zu steigern. „Startups müssen lernen, den ‚Fußstapfen riesiger Bestien‘ auszuweichen. Alle großen Unternehmen entstehen aus kleinen Lücken.“ Liang Yu sagte, dass sich der aktuelle Wettbewerb, das Kapitalumfeld und die Talente für Großunternehmertum im Vergleich zu den letzten zwei Jahren stark verändert haben technische Fähigkeiten und Branchenverständnis.
Sun Bin glaubt, dass aktuelle Unternehmer genauso wie der Mitbegründer von OpenAI vor 8 Jahren Technologie, Ressourcen, Verbindungen und andere Anhäufungen nutzten, um ein Unternehmen zu gründen, drei Dinge berücksichtigen müssen: Rechenleistung, Ingenieure und Daten Wenn Sie ein Unternehmen gründen, können Sie mit halbem Aufwand das Doppelte erzielen.
Viele Redner auf dem Gipfel verwiesen auf künstliche allgemeine Intelligenz (AGI) als das Ende der KI-Entwicklung. Was ist das ultimative Problem, das es lösen möchte? Huang Dongyan glaubt, dass allgemeine künstliche Intelligenz und künstliche Intelligenz in vertikalen Bereichen tatsächlich einander ergänzen. Intuitiv gesehen werden große Hersteller eine Plattform für allgemeine künstliche Intelligenz bereitstellen, während künstliche Intelligenz in vertikalen Bereichen eine tiefgreifende Entwicklung durchführen soll verschiedene Branchen.Sun Bin sagte, wenn man die Gegenwart in zehn Jahren betrachtet, könnte dies der Ausgangspunkt der allgemeinen künstlichen Intelligenz sein. Liang Yu erwähnte auch, dass dieses Jahr das erste Jahr der allgemeinen künstlichen Intelligenz sein könnte. Von heute an könnte die allgemeine künstliche Intelligenz langsam in alle Aspekte der Produktion und des Lebens der Menschen wie Wasser und Elektrizität eindringen.
Zhang Guoren sagte, dass vielleicht schon viele Science-Fiction-Filme das Auftreten allgemeiner künstlicher Intelligenz für uns dargestellt haben, wie etwa Jarvis in Iron Man und MOSS in The Wandering Earth. Obwohl die Formen unterschiedlich sind, werden sie das Niveau der Intelligenz erreichen. Oder mehr als menschlich.
▲Zhang Guoren, Mitbegründer und Chefredakteur von Zhiyi Technology
Wenn wir also 10 Jahre später auf die heutige Welle der AIGC-Anwendungsinnovationen zurückblicken, welche Bedeutung und Auswirkungen werden sie auf die haben Technologieindustrie und menschliche Gesellschaft?
Sun Bin glaubt, dass dies, wenn wir zehn Jahre später auf heute blicken, eine große Veränderung in der Art und Weise sein wird, wie Computer interagieren, sodass Menschen keine komplexen Sprachen mehr lernen müssen. Liang Yucheng erwähnte auch, dass dieses Jahr das erste Jahr der allgemeinen künstlichen Intelligenz sein könnte. Von heute an könnte die allgemeine künstliche Intelligenz langsam in alle Aspekte der Produktion und des Lebens der Menschen wie Wasser und Elektrizität eindringen.
Aus ethischer Sicht sagte Huang Dongyan: „Es ist sehr entscheidend, die positiven Auswirkungen von Technologie auf der Grundlage der menschlichen Natur zu stimulieren. In zehn Jahren wird vielleicht jeder einen eigenen intelligenten Roboter haben, damit die Menschen besser ausgerüstet sein können.“ nach der Verbesserung der Effizienz. „Genießen Sie das Leben sicher.“ Darüber hinaus sind Sicherheits- und ethische Fragen für die Industrie zu einem Anliegen geworden. Huang Dongyan glaubt, dass eine umfassende Governance erforderlich ist, die Gesetze und Vorschriften, Selbstdisziplin des Unternehmens, öffentliches Bewusstsein, Standards der Sicherheitsethik usw. umfasst.
Zhang Guoren kam zu dem Schluss, dass es in zehn Jahren viele Dinge geben sollte, an die wir heute gewöhnt sind, die bis dahin jedoch ungewöhnlich sein werden. Aus heutiger Sicht ist dies so, wie die Menschen es heute gewohnt sind, elektronische Zahlungen zu nutzen. oder frühere Einführung von Barzahlungsmethoden.
Im großen Modellforum am Nachmittag erklärte Zhang Peng, CEO von Beijing Zhipu Huazhang Technology Co., Ltd., das vorab trainierte große Modell, die Grundlage der generativen KI-Ära, Gründer von Luchen Technology, Singapur You Yang, der junge Professor und Präsident der Abteilung für Informatik der National University, diskutierte die Herausforderungen und Praktiken des kostengünstigen Trainings großer KI-Modelle.
Shi Jianping, Investmentpartner von Lanchi Ventures, glaubt, dass vorab trainierte große Sprachmodelle das Zeitalter der kognitiven Intelligenz einläuten werden. Präsident der Large Device Business Group, berechnet Es bringt Erkenntnisse aus den praktischen Aspekten von Leistung und Algorithmen.
1. Zhipu AI Zhang Peng: Auch große Modelle nutzen das Mooresche Gesetz und erkunden neue Wege für GLM
Der erste Redner des großen Modellforums ist Zhang Peng, CEO von Beijing Zhipu Huazhang Technology Co., Ltd. (siehe zu as: Zhipu AI) . Als Pionier in Industrie und Wissenschaft teilte er den technischen Weg und den Implementierungsfortschritt bei der Vorschulung großer Modelle.
▲Zhang Peng, CEO von Beijing Zhipu Huazhang Technology Co., Ltd.
Vorab trainierte große Modelle sind zur Infrastruktur für eine neue Generation von KI-Anwendungen geworden. Zhang Peng sagte, dass es im Bereich großer Modelle ein Mooresches Gesetz gibt: Die Anzahl der Parameter in einem einzelnen Modell wird jedes Jahr um das Zehnfache zunehmen. Wenn Modellparameter Hunderte von Milliarden erreichen, haben große Modelle eine wichtige Schwelle für qualitative Veränderungen überschritten, und ChatGPT ist ein repräsentatives Beispiel.
„Wir haben hart gearbeitet.“ Zhang Peng sagte, dass Zhipu AI 2021 auf der Grundlage der Umsetzung der Ergebnisse der Fakultät für Informatik der Tsinghua-Universität sein erstes multimodales großes Modell auf den Markt gebracht habe. Zhang Peng sagte, dass das Training eines 100-Milliarden-Modells mit verschiedenen Herausforderungen verbunden sei und Geduld und Zeit erfordere.
Zhang Peng sagte, dass der Bewertungsbericht des von Zhipu AI gemeinsam entwickelten zweisprachigen GLM-130B-Modells zeigt, dass GLM-130B in Bezug auf Genauigkeit und Fairness-Indikatoren dem GPT-3 175B (davinci) nahe kommt oder ihm gleichkommt. Darüber hinaus hat Zhipu AI seit letztem Jahr sukzessive das AI-Code-Tool CodeGeeX als Open-Source-Lösung bereitgestellt und das Open-Source-Modell ChatGLM-6B veröffentlicht, das auf einer einzigen Karte ausgeführt werden kann. Gleichzeitig wurde das kostenlose Hilfsschreiben eingeführt Anwendungen wie „Writing Frog“ und das personalisierte Dialogprodukt „Xiaodai“, was die Hemmschwelle für die Verwendung großer Modelle deutlich senkt.
Abschließend betonte Zhang Peng bei dem Treffen das Model as a Service (MaaS)-Konzept und plädierte für die Bereitstellung flexibler Bereitstellungsmethoden von vorab trainierten großen Modellen über APIs bis hin zu mehrstufigen Anwendungen und von der Cloud über Privatisierung bis hin zu All-in-One Einsatz.
2. Luchen Technology Youyang: Bauen Sie eine große Modelltrainingsinfrastruktur Colossal-AI auf, um die Kosten für die Implementierung großer KI-Modellanwendungen zu senken
Die Anzahl der KI-Modellparameter hat sich in nur wenigen Jahren um das Zehntausende erhöht. In Zukunft könnte KI intelligenter und leistungsfähiger sein als das menschliche Gehirn. Die Herausforderung, vor der das Training großer Modelle heute steht, sind die extrem hohen Trainingskosten.
Während sich Big Data und große Modelle gleichzeitig verbessern, ist die Frage, wie effektivere Optimierungsmethoden erstellt, Kosten gesenkt und die Effizienz gesteigert, skalierbare und effiziente Datenverarbeitung erreicht und die Anwendungsimplementierungskosten großer KI-Modelle gesenkt werden können, zu einem zentralen Problem geworden Industrie.
Luchen Technology hat eine Reihe effizienter verteilter KI-Trainingsinfrastrukturen für große Modelle von Colossal-AI aufgebaut. Es besteht aus drei Teilen: effizientem Speicherverwaltungssystem, N-dimensionaler Paralleltechnologie und groß angelegter Optimierungsmethode.
Laut dem jungen Professor You Yang, Gründer von Luchen Technology und Präsident der Abteilung für Informatik an der National University of Singapore, hat sich Colossal-AI zu einer der am schnellsten wachsenden Software auf dem globalen Markt für Basissoftware entwickelt und ist Open Source auf Github: https://github.com/hpcaitech/ColossalAI
▲You Yang, Gründer von Luchen Technology und Präsident des Department of Computer Science an der National University of Singapore, junger Professor You Yang
The N Die von Luchen Technology entwickelte -dimensionale Paralleltechnologie erzeugt eine höherdimensionale Tensorparallelität. Eine Vielzahl darin enthaltener Parallelstrategien bietet eine kostengünstigere und effizientere verteilte Trainingslösung für große Modelle.
Darüber hinaus müssen Benutzer basierend auf dem heterogenen Planungssystem von Colossal-AI nur eine Codezeile schreiben, um GPU-Speicher, CPU-Speicher und Festplatte dynamisch zu verwalten, wodurch die Modellkapazität der Hardware um ein Dutzendfaches erhöht wird.
Zum Beispiel erforderte das bisherige GPT-3-Training mit 175 Milliarden Parametern 128 GPUs, während Colossal-AI nur 64 GPUs benötigte, was die Hardwareanforderungen und Kosten großer Modelle deutlich reduzierte. Mit der gleichen Ausstattung kann Colossal-AI Benutzern dabei helfen, das Modelltraining schneller abzuschließen und die Kosten zu senken.
3. Kognitive Intelligenz ist zur Spitze der KI geworden und „AI-First-Anwendungen“ sind zum Trend geworden
Shi Jianping, Investmentpartner von Lanchi Ventures, schlug diese große vorab trainierte Sprache vor Modelle eröffnen Kognition Im Zeitalter der Intelligenz ist die kognitive Intelligenz zur nächsten Grenze der KI geworden.
▲Shi Jianping, Investmentpartner von Lanchi Ventures
Maschinen erlangen beispiellose kognitive Fähigkeiten wie Sprachgenerierung und -verständnis, Wissensschlussfolgerung usw. Dahinter stehen AI OS (Betriebssystem), Basismodelle und Vorschulung Modelle und Erweiterungen, Lerntechnologie und andere Aspekte sind bereit.
Wie können Startups die Welt der kognitiven Intelligenz erobern? Shi Jianping schlug vor, dass nicht alle Unternehmen große Modelle erstellen müssen. Sie können auch von der Plattform ausgehen, indem sie ihre eigenen Daten zur Feinabstimmung von Open-Source-Modellen verwenden B. Bereitstellung nachgelagerter vertikaler Anwendungsentwickler. Bereitstellung von Plattformtools wie Schulung, Feinabstimmung, Verwaltung und Diensten.
Er sagte: „Vorab trainierte sprachliche Großmodelle haben eine Ära des intelligenten Rechnens mit kognitiver Intelligenz als zentraler treibender Kraft eingeleitet.“ Die Grundlage der digitalen Zivilisation ist Code, und kognitive Intelligenz wird auch die Art und Weise, wie Software erstellt wird, neu definieren.“ KI „-First Application“ wird zum Trend werden. Die neue Version von Microsofts Suchmaschine Bing hat beispielsweise bereits hervorragende Beispiele geliefert.
„Das aktuelle Tempo der Technologieiteration ist schneller als PPT.“ Wie können Unternehmen vor diesem Hintergrund zentrale Wettbewerbsvorteile erzielen? Seiner Ansicht nach wird der Kern darin bestehen, eigene Daten zu nutzen, um Modelle der künstlichen Intelligenz zu trainieren und zu verfeinern. Gleichzeitig wird die Integration der intelligenten Welt und der digitalen Welt mehr Fantasie bringen.
4. NVIDIA Xu Tianhao: Die Zusammenarbeit von Software und Hardware ermöglicht eine Rechenleistungseffizienz von über 50 % beim Training von GPT3 auf großen Clustern
Die Verbesserung der Hardware-Rechenleistung hängt nicht nur von der Verbesserung der Chip-Technologie ab, sondern auch von der genauen Erfassung der Anforderungen und Trends der Entwicklung von KI-Modellalgorithmen Schlüsselpunkte der Rechenbeschleunigung und weitere Innovationen.“
▲ Um das Training eines Modells durchzuführen, sind mehrere einzelne Komponenten erforderlich, um miteinander zusammenarbeitende Maschinenknoten zu ermöglichen.
NVIDIA führt NVLink-, NVSwitch- und IB-Technologien ein. Die Ampere- und Hopper-Architekturen erstellen Knoten auf Basis von NVSwitch und führen Cluster-Netzwerke über das IB-Netzwerk durch, sodass diese leistungsstarken Personen effizient zusammenarbeiten können, um dasselbe zu erreichen.
Die zugrunde liegende Hardware ist die Basis. Damit Entwickler die Hardware nutzen und das Problem wirklich lösen können, ist Software-Zusammenarbeit erforderlich. Daher hat NVIDIA in der Vergangenheit SDKs und Szenenanwendungen entwickelt, um Probleme in verschiedenen Branchen zu lösen. Unter anderem wurde NeMo Framework entwickelt, um die Probleme des Trainings und der Inferenzbereitstellung großer Modelle zu lösen.
Wie kann man also beurteilen, wie viele Ressourcen für das Training von GPT-3 benötigt werden? Xu Tianhao erklärte eine Formel: Verbrauchte Zeit = erforderliche FLOPS zur Erstellung eines größeren Modells/effektive Rechenleistung der Hardware. Basierend auf der effektiven Integration paralleler Methoden und einer Reihe von Optimierungen kann das NeMo Framework von NVIDIA dafür sorgen, dass die effektive Leistung der Hardware-Rechenleistung während des Trainings von GPT-3 mehr als 50 % erreicht.
Um die groß angelegte Bereitstellung großer Modelle durch Unternehmen zu beschleunigen, bietet NVIDIA NeMo Framework außerdem eine integrierte Lösung für große Modelle, die auf der Integration von FasterTransformer und Triton basiert.
5. Yang Fan von SenseTime: Das KI-Produktionsparadigma hat große Veränderungen erfahren, und künstliche Intelligenz wird ein wohlhabenderes „Zeitalter der Entdeckung“ einläutenBei dem Treffen sagte der Mitbegründer und Präsident von SenseTime Der große Gerätekonzern Yang Fan erläuterte den Weg des Wandels und den Kompetenzkreis der Startups, die aus der „Ära der kleinen Modelle“ hervorgegangen sind.
▲Yang Fan, Mitbegründer von SenseTime und Präsident der großen Geräteunternehmensgruppe
AI führt eine neue Generation der technologischen Revolution an, von KI-gestützter wissenschaftlicher Forschung und generativer KI bis hin zum kürzlich beliebten Konversationsroboter ChatGPT . Große (Rechen-)Macht bewirkt Wunder, und quantitative Veränderungen führen zu qualitativen Veränderungen. Yang Fan sagte, dass das KI-Produktionsparadigma einen großen Wandel erlebe – die Ära der großen Modelle stehe vor der Tür.
Yang Fan sagte, dass in der KI-Ära des „kleinen Modells“ in den letzten 10 Jahren Deep-Learning-Methoden und industrialisierte kleine Modellproduktionswerkzeuge zur Lösung einzelner Probleme in der neuen Ära des großen Modells allmählich ausgereift seien Service (MaaS) ist zum neuen Thema geworden. Das Thema brachte ein neues KI-Paradigma hervor, das sich auf die Kostenreduzierung großer Modellinfrastrukturen, das Wettrüsten mit Rechenleistung und Daten sowie auf Echtzeit-Benutzerfeedback konzentriert.
Angesichts dieses Trends hat SenseTime, das seit fast 10 Jahren in der KI verwurzelt ist, das SenseCore-Großgerät entwickelt, das die Entwicklung extrem großer Modelle auf vier Ebenen ermöglicht: native KI-Infrastruktur, große Modellproduktionsplattform, Algorithmus-Modelldienste und Erfahrung in der Industrie.
Yang Fan sagte, dass SenseTime jahrelange gesammelte Branchenerfahrung bündeln wird, um hocheffiziente, kostengünstige und groß angelegte KI-Infrastrukturprodukte und -dienste der neuen Generation bereitzustellen und die Produktion und Bereitstellung von Hunderten Milliarden großer Modelle auf der ganzen Welt zu beschleunigen Stapeln und fördern Sie die Datenerfassung und Annotation. Die Verwaltungseffizienz wurde erheblich verbessert und der Modelliterationszyklus wurde verkürzt. Gleichzeitig wird SenseTime auch Unterstützungsdienste für die Entwicklung großer Modelle bereitstellen, um die Umsetzung der Entwicklungsergebnisse sicherzustellen.
6. ChatGPT-ähnliche Sondersitzung: Der Kampf zwischen To B und To C, großes Modell vs. kleines Modell
Li Xiaohan, Mitbegründer und Vizepräsident von Yunzhisheng, sagte, dass dies der Fall sein wird Sein größter Einfluss sei, dass AGI in den nächsten Jahren Realität werden könnte, und sie suchen nach Möglichkeiten, sich in die Welle großer Modelle zu integrieren.
▲Li Xiaohan, Mitbegründer und Vizepräsident von Yunzhisheng
Die KI-Evolution zeigt drei Gesetze, von algorithmuszentriert zu modellzentriert, von kleinen und schönen zu großen Projekten und dem Rückgang von Zwischenaufgaben. Unter Zwischenaufgaben versteht man Zwischenaufgaben, die in der bisherigen Entwicklung der KI keine eigenständigen Ziele hatten und nach und nach geschwächt werden oder verschwinden.
Vor 2022 bauen sowohl Giganten als auch KI-Startups große Modelle, und das Aufkommen von ChatGPT hat die Machbarkeit dieses Weges für die Branche bestätigt. „Wenn die Modellparameter einen bestimmten Maßstab erreichen, können ‚neue‘ Fähigkeiten auftreten“, sagte Li Xiaohan, und auf der Ebene der kognitiven Intelligenz könnten Maschinen nach einer bestimmten Entwicklungsphase den Menschen übertreffen.
Gleichzeitig haben große Modelle zu zwei Wegen für die Unternehmensentwicklung geführt, nämlich zur Schaffung allgemeiner großer Modelldienste und großer Modelle für vertikale Szenarien. Die allgemeine Großmodellplattform großer Hersteller wird externe Dienstleistungen erbringen und Modellschwungräder zum „Kohlpreis“ produzieren. Unternehmen, die mit unterschiedlichen Szenarien konfrontiert sind, benötigen mehr vertikale Großmodelle und legen mehr Wert auf die Steuerbarkeit von Daten und Diensten.
Yunzhisheng wird sich auf die intelligente Medizinbranche konzentrieren, große Modelle für bestimmte Branchen auf den Markt bringen und Kunden auf der Grundlage der Branche unternehmensspezifische große Modelle anbieten. Li Xiaohan sagte, ihre Vision bestehe darin, von der Industrieversion zur erweiterten Universalversion zu wechseln.
2. Jian Renxian von Zhujian Intelligence: „Großes Sprachmodell + Wissen + Anwendung“, das zukünftige Betriebssystem der allgemeinen künstlichen Intelligenz
Jian Renxian, Gründer und CEO von Zhujian Intelligence, sagte, dass große Sprachmodelle das werden werden Grundlage der allgemeinen künstlichen Intelligenz Das Betriebssystem wird „zwei Welten“ bringen, eine ist die von OpenAI und Microsoft angeführte Closed-Source-Welt und die andere ist die von Deepmind und Google angeführte Open-Source-Welt. Er glaubt, dass die Kombination von Start-ups und großen Unternehmen es Innovationen ermöglichen wird, eine Größenordnung zu erreichen und eine Situation zu schaffen, in der „hundert Blumen blühen“.
▲Jian Renxian, Gründer und CEO von Zhujian Intelligence
Er wies außerdem darauf hin, dass das zukünftige Software-Paradigma Anwendungen sein werden, die auf natürlicher Sprachtechnologie basieren und aus „großem Sprachmodell + Wissen + Anwendung“ bestehen. Er glaubt, dass das Modell selbst keinen tatsächlichen Wert hat, aber die segmentierten Anwendungen, die auf großen Sprachmodellen basieren, haben einen tatsächlichen Wert. Daher leitet er die Entwicklung von „Model as an Application“ (MaaA) und nicht von „Model as a Service“ (MaaS). ).
Jian Renxian glaubt, dass Anwendungen, die auf ChatGPT basieren, einen enormen Mehrwert für Angestellte und Unternehmen bieten werden, wie z. B. Kundendienstautomatisierung, virtuelle Assistenten, Wissensmanagement und Mitarbeiterschulung.
Um die Vor- und Nachteile großer Sprachmodelle und kleiner Sprachmodelle auszugleichen, schlug Jian Renxian eine Formel vor: „Kleines Modell zur Verarbeitung natürlicher Sprache + Wissensmodell + großes Modell = Dual-Engines zur Verarbeitung natürlicher Sprache“. kann große Modelle leistungsfähiger machen. Kontrollierbarer, benutzerfreundlicher und erklärbarer. Derzeit hat Zhujian Intelligence sein Fachwissen in der Verarbeitung natürlicher Sprache genutzt, um bestehende skalierbare Produkte mit umfangreichen Sprachmodellen zu integrieren und vorab trainierte Modelle für verschiedene Branchen bereitzustellen.
3. Kunlun Wanwei Fanghan: Es gibt drei große Lücken in der Entwicklung großer Modelle zwischen China und dem Ausland. Inländische Geschäftsmodellinnovationen beginnen mit Unternehmensdienstleistungen.
Große Modelle mit Hunderten von Milliarden Modellen entstehen. Echte allgemeine künstliche Intelligenz, der iPhone-Moment der KI hat bereits begonnen. Fang Han, CEO von Kunlun Wanwei, sagte, dass ChatGPT ein Meilenstein in der Entwicklung von kohlenstoffbasiertem Leben zu siliziumbasiertem Leben werden könnte und es die zweite Entwicklung in der Geschichte der Menschheit sein werde.
▲Fang Han, CEO von Kunlun Wanwei
Die derzeitige Lücke in der Entwicklung großer Modelle zwischen China und dem Ausland umfasst jedoch drei Aspekte: Erstens sind die jährlichen Kosten von 50 bis 100 Millionen US-Dollar die Eintrittskarte für die Ausbildung von Hunderten Milliarden großer Modelle Die Qualität chinesischer Texte ist nicht hoch. Die größte Lücke ist die technische Lücke.
Fang Han sagte, dass die Bemühungen von OpenAI in Richtung GPT beweisen, dass allgemeine künstliche Intelligenz erreichbar ist. Nachdem GPT-3 gerade veröffentlicht und getestet worden war, glaubte er, dass GPT-3 einen Meilenstein für AIGC darstellte und den Bereich der Inhaltsgenerierung erheblich untergraben würde.
Auf Anwendungsebene sagte Fang Han, dass die AIGC-Branche der Logik folgen wird, die Kosten für die B-Seite zu senken und die Effizienz für die C-Seite zu steigern. Es ist ersichtlich, dass Microsofts Layout auf der B-Seite auf große Kunden in Branchen wie Finanzen und Energie ausgerichtet ist. Der Grund dafür ist, dass „die Daten dieser Unternehmen mit großen Modellen wie GPT kombiniert werden können, um die Produktion der nächsten Generation zu generieren.“ Paradigma." Auf der C-Seite wird es am Beispiel von Microsofts Copilot die Produktivität der Menschen verbessern.
Daher prognostiziert Fang Han, dass Geschäftsmodellinnovationen in der heimischen AIGC-Branche zunächst im Bereich der B-seitigen Unternehmensdienste auftreten werden, gefolgt vom Bereich der C-seitigen UGC-Tools.
Am Nachmittag AIGC-Sonderforum zur Anwendungsinnovation, aiXcoder CTO Hao Yiyang, Filmpu Group Director und Beijing President Fan Shuo, Computational Aesthetics (Nolibox)-Mitbegründer Huang Shengyu diskutierte die Kollision und Integration von AIGC mit Codegenerierung, Metaverse, Design und Kreativität und anderen Branchen.
1. aiXcoder Hao Yiyang: GPT-4 hat neue Änderungen in der Codegenerierung mit sich gebracht und wird in Zukunft die Erweiterung der Modelle auf Hunderte von Milliarden fördern
Bei dem Treffen sagte Hao Yiyang, CTO von aiXcoder (Silicon Heart Technology). brachte ein Thema mit dem Titel „Large-scale Language Model“ mit. Keynote-Vortrag zum Thema „Code Generation in the (LLM) Era“.
Er sagte, dass GPT-4 neue Änderungen bei der Codegenerierung mit sich gebracht habe, längere Sequenzen, eine feinere Abstimmung von Befehlsnummern, multimodale (Bildeingabe) und andere Operationen unterstütze, Effekte zeige, die für den allgemeinen Gebrauch besser geeignet seien, und Gleichzeitig gibt es auch viele Probleme, darunter das Fehlen relevanter Dateien, abhängiger Bibliotheken und Anforderungsdokumente, langsame Geschwindigkeit, Bedrohungen der Informationssicherheit usw.
Tatsächlich gibt es einen großen Unterschied zwischen prozeduralen Generierungsmodellen und Sprachmodellen. In Bezug auf Interaktionsmethoden konzentrieren sich gewöhnliche Dialog-Sprachmodelle hauptsächlich auf Fragen und Antworten sowie auf die Fortsetzung, während prozedurale Generierungsmodelle die Lücken füllen müssen , vervollständigen und sichern. Es gibt immer noch viele Dinge, die GPT-4 bei der Codegenerierung nicht leisten kann. Im Hinblick auf die Echtzeitleistung ist GPT-4 beispielsweise in einigen Codekorrektur- und Codevervollständigungsszenarien, die Echtzeit-Kontextsequenzen erfordern, nicht anwendbar Es ist immer noch schwierig, den gesamten Kontext mittlerer und großer Projekte zu berücksichtigen. Es besteht eine große Lücke zwischen den vollständigen Informationen von Code-Projekten und dem Text des Web-Crawlings.
Als Startup, das 2018 in den Bereich der intelligenten KI-Programmierroboter einstieg, brachte aiXcoder im Juni 2022 das landesweit erste Pre-Training-Modellprodukt zur Codegenerierung aiXcoder XL auf den Markt. Das Produkt unterstützt die Ausgabe von voll funktionsfähigen Eingaben in natürlicher Sprache bis hin zu vollwertigen Programmiersprachen.
Mit Blick auf die aiXcoder-Roadmap sagte Hao Yiyang, dass aiXcoder die Erweiterung von Modellen von Dutzenden Milliarden auf Hunderte Milliarden fördern, eine große Menge gemischter Daten aus Verarbeitung natürlicher Sprache + Code hinzufügen und speziell Befehlsdatensätze dafür erstellen wird verschiedene Szenarien in der Programmierung, wodurch ein Codebearbeitungstool mit besserer Gesamtleistung erhalten wird. Hao Yiyang, CTO von aiXcoder (Silicon Heart Technology)
Generative KI hat ein explosives Stadium erreicht, und die Explosion der Anwendungen, die sie mit sich bringt, lässt die Menschen spüren, wie die KI von der Wahrnehmung zur kognitiven Intelligenz übergeht, und eröffnet einen großen Marktraum.ChatGPT hat die Textmodalität in eine Explosionsphase gebracht, aber die Explosionsphase von Bildern, Videos und Tönen ist noch nicht in dieser Ära angekommen. Fan Shuo, Direktor der Movie Book Group und Präsident des Beijing District, sagte, dass Bilder, Videos und sogar digitale Zwillinge mit dem Aufkommen der Branchenanforderungen und der Verbesserung der Produktionseffizienz in Zukunft zu einem unumkehrbaren Trend werden werden, der intuitiver und intuitiver wird bequem für Menschen, Informationen zu erhalten.
▲Fan Shuo, Direktor der Film Group und Präsident des Bezirks Peking
Der gesamte technologische Wandel ist derselbe wie der Prozess der menschlichen Entwicklung, von der Lösung sich wiederholender Aufgaben bis zum Nachdenken über Logik und Kreativität.
Derzeit hat die Textmodalität die Produktivität der Menschen verbessert. Fan Shuo sagte: „2023 bis 2025 wird eine Ära der multimodalen Explosion sein, die durch generative KI erstellt wird.“ sondern eine benutzerdefinierte, selbstinteraktive Produktion.
Darüber hinaus sind für Terminalunternehmen „Modelle für viele Unternehmen nicht direkt zugänglich, daher erfordert das Modell mehr Anwendungen zur Verbindung und mehr Plattformen zur Unterstützung, und dann können die Daten strukturiert und erst dann produziert werden.“ Ist der Inhalt standardisiert und optimiert, kann er wirklich auf den gesamten Prozess der Inhaltserstellung angewendet werden. Movie Group hat ein digitales KI-Betriebssystem entwickelt.
Die Entwicklung der großen Modellindustrie wird sich weiterhin an einige sich wiederholende Arbeiten im Bereich der Inhaltsgenerierung anpassen. In Zukunft wird ihr System Standardisierungsfähigkeiten erreichen und gleichzeitig an entsprechende offene Motoren andocken, um ein Gesamtökosystem aufzubauen strahlen verschiedene Modelle wie Text, Ton, Bilder und Videos aus.
3. Computerästhetik Huang Shengyu: Ergreifen Sie die „drei Elemente“ der Transformation und lassen Sie AIGC die Designkreativität vorantreiben
KI beeinflusst die menschliche Kunst. Huang Shengyu, Mitbegründer von Computational Aesthetics (Nolibox), berichtete, wie AIGC Innovationen im Design und bei kreativen Produktionsmechanismen vorantreibt.
▲ Huang Shengyu, Mitbegründer von Computational Aesthetics (Nolibox), sagte, dass die Integration und Entwicklung von Design und Computer drei Phasen durchlaufen habe: die 1.0-Ära ist maschinengestütztes Design, repräsentiert durch Adobe, und die 2.0-Ära Die Ära 3.0 basiert auf dem maschinengestützten Design von Adobe und anderen Tools. Zu diesem Zweck hat Computational Aesthetics Tools wie „Picture Universe“ und „Paint Universe“ eingeführt ".
„Intelligentes Design ist für die Designbranche das, was autonomes Fahren für die Transportbranche ist.“ Huang Shengyu sagte: „Aber Designverhalten ist komplex und es gibt im Allgemeinen keine optimale Lösung. Die Optimierungsfunktion ist oft nicht eindeutig und klar.“
Die Verwirklichung von kontrollierbarem Design und kreativer Produktion durch AIGC steht vor mindestens drei großen Herausforderungen: 1. Die sprachliche Inkommensurabilität von Mensch und Maschine, wenn es um Kreativität geht. 2. Erfassen und analysieren Sie komplexe kreative Designanforderungen. 3. Designbasierte kreative Lösungen sind schwer zu iterieren und umzusetzen. In diesem Zusammenhang schlug Huang Shengyu „drei Elemente“ für die Umwandlung der Designkognition in Roboterkognition vor: 1. Die quantifizierbare Natur von Designressourcen. 2. Die Generalisierbarkeit der Designerfahrung. 3. Simulation des Designverhaltens.
Computational Aesthetics wurde 2020 gegründet und ist ein von der Tsinghua-Universität gegründetes Technologieunternehmen. Zu seinen Kernprodukten gehören das AIGC-Produktivitätstool „Hua Universe“ und die intelligente Design-Engine „Hua“. Universe“ ist der nächste Schritt der Start der KI-Design-Kreativplattform Yeahpix.
Fazit: Generative KI bringt die Innovation des Content-Produktions- und Interaktionsparadigmas zum Vorschein und läutet den Beginn einer neuen Ära der KI ein
Bei dieser AIGC-Veranstaltung haben wir gesehen, dass ChatGPT aus der Entwicklung und Anhäufung von Technologie im Zeitalter großer Modelle entstanden ist, was die Industrie, die Wissenschaft und die Investmentgemeinschaft begeistert hat. Gleichzeitig ist dieses phänomenale Produkt zu einem Meilenstein im Zeitalter der Großmodelle geworden und zeigt das Potenzial für die Entstehung von Intelligenz für Unternehmen, die sich seit vielen Jahren intensiv mit Großmodellen beschäftigen.
Gleichzeitig ist der Umfang der Modellparameter explodiert und die Schwierigkeit, Hunderte Milliarden Modelle zu trainieren, kann man sich vorstellen. Auf der Ebene der KI-Chips und der Rechenleistung gibt es Möglichkeiten für den groß angelegten Einsatz generativer Methoden KI-Produkte.
Generative KI hat bahnbrechende Anwendungsinnovationen, von Texten, Bildern, Codes, Videos und sogar kreativer Produktion, in die Metaverse-Branche gebracht. Generative KI hat in verschiedenen Branchen unbegrenzten Raum für Kreativität und Fantasie eröffnet. Immer mehr ChatGPT-ähnliche Produkte werden kommerzialisiert, und KI dringt in alle Lebensbereiche vor und beschleunigt das Zeitalter der allgemeinen künstlichen Intelligenz.
Mit Blick auf die Zukunft führt uns die generative KI in eine neue Welt der KI, und das schnell voranschreitende ChatGPT leitet eine neue Runde der technologischen Revolution ein.
Der GTIC 2023 China AIGC Innovation Summit wird zu einer wichtigen Plattform für Industrie, Wissenschaft und Forschungskreise, um einen intensiven Austausch zu führen und Ideen rund um Spitzentechnologien und die industrielle Umsetzung anzuregen. AIGC-Unternehmen in verschiedenen Unterabteilungen sind eingeladen, Zeugen davon zu werden Ankunft der neuen Ära der KI.
Das obige ist der detaillierte Inhalt vonDer erste hochkarätige AIGC-Gipfel in China war ein großartiges Ereignis! Tausende Worte trockener Informationen plauderten über die GPT-4-Ära und fassten die Reden von 21 Experten zusammen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!