Seit kurzem haben sich Internetgiganten der großen Modellbahn angeschlossen.
Gestern explodierte die Nachricht, dass Meister Li Mu Amazon verlassen hat, um an einem Großmodell zu arbeiten, wie ein Donnerschlag in allen sozialen Netzwerken.
Dann wurde heute bekannt gegeben, dass das neue Unternehmen, das vom ehemaligen Kuaishou-KI-Kernchef Li Yan nach seinem Ausscheiden aus Kuaishou im Jahr 2022 gegründet wurde, auch große Modelle herstellt.
Seit ChatGPT es der Welt ermöglicht, die Anwendungsszenarien von KI zu sehen, hat sich der Wettbewerb in der KI-Modellebene unter inländischen Unternehmen offensichtlich verschärft.
Li Yan gründete in der zweiten Hälfte des Jahres 2022 das KI-Unternehmen „Yuanshi Technology“, das hauptsächlich Forschung und Entwicklung multimodaler Großmodelle durchführt.
Li Yan ist ein alter Mitarbeiter von Kuaishou mit einer Jobnummer von rund 75 und auch die Kernfigur in der Forschung und Entwicklung der Kuaishou-KI-Technologie.
Im November 2015 gründete Li Yan mit Unterstützung von Su Hua, dem damaligen CEO von Kuaishou, die erste interne Deep-Learning-Abteilung DL (Deep Learning)-Gruppe mit dem Ziel, Algorithmusmodelle zu entwickeln, um illegale Videoinhalte zu identifizieren .
In der Folge hatte Kuaishou einen größeren Bedarf an Videoinhaltsverständnis. Im Jahr 2016 änderte Li Yan den Namen des Teams von der DL-Gruppe in die MMU-Gruppe (Multimedia Understanding, Multimedia Content Understanding). Neben der Lösung von Sicherheits-Compliance-Problemen beschäftigte sich das Team auch mit der Forschung und Entwicklung von Algorithmusmodellen in verschiedenen Formen wie Sprache, Text und Bilder.
Auf der CNCC-Konferenz 2018 hielt Li Yan eine Rede mit dem Titel „Multimodale Inhaltsproduktion und -verständnis“ und betonte die Bedeutung der multimodalen Modelltechnologie:
Nehmen Sie als Beispiel die kurzen Videos, die wir oft ansehen. Neben multimodalen Informationen wie visuellen, akustischen und textlichen Informationen ist auch das Benutzerverhalten ein weiteres modales Datenelement.
Auf diese Weise stellen das Video selbst und das Verhalten des Benutzers zusammen ein sehr komplexes multimodales Problem dar.
Der Zweck der multimodalen Forschung besteht darin, die Interaktion zwischen Mensch und Computer immer natürlicher und komfortabler zu gestalten.
Allerdings ist multimodale Forschung ziemlich schwierig.
Einerseits müssen wir uns dem semantischen Lückenproblem einzelner Modalitäten und dem heterogenen Lückenproblem stellen, wie Daten verschiedener Modalitäten umfassend modelliert werden können. Andererseits müssen wir auch die Schwierigkeit lösen, mehrere zu konstruieren -modale Datensätze, was zu Problemen mit fehlenden Daten führt.
Zu dieser Zeit blieben viele Studien in der akademischen Gemeinschaft noch im Bereich der Einzelmodalität, aber Li Yan glaubte fest daran, dass Multimodalität in Zukunft eine wertvollere Forschungsrichtung werden wird.
Die Erfahrung in Kuaishou vermittelte Li Yan in kurzen Videos ein tiefes Verständnis des Ökosystems der KI. Im Jahr 2021 entschied er sich, Kuaishou zu verlassen.
In der zweiten Hälfte des Jahres 2022 gründete er Yuanshi Technology. Nach der exklusiven Bestätigung von 36Kr liegt der Schwerpunkt von Yuanshi Technology auf der Forschung und Entwicklung multimodaler Großmodelle.
Und gestern überschwemmte die Nachricht, dass Meister Li Mu verdächtigt wurde, einem großen Modelgeschäft beizutreten, sofort auch die sozialen Netzwerke.
Laut dem öffentlichen Konto „Dear Data“ verließ Alex Smola, der „Vater des Parameterservers“, Amazon im Februar dieses Jahres und gründete ein Unternehmen für künstliche Intelligenz namens Boson.ai.
Zur Vorstellung dieses neuen Unternehmens gibt es nicht viele Informationen und die offizielle Seite befindet sich noch im Aufbau.
Link: https://boson.ai/
Natürlich müssen wir große modellbezogene Projekte durchführen.
Außerdem laut Alex‘ LinkedIn-Profil: „Wir machen etwas Großes. Wenn Sie an dem skalierbaren Basismodell interessiert sind, kontaktieren Sie mich bitte.“ Auf der GitHub-Homepage hat Amazons Chefwissenschaftler Li Mu ebenfalls Code beigesteuert.
Daher wird spekuliert, dass Li Mu sich Boson.ai angeschlossen hat und mit seinem Mentor ein Unternehmen gegründet hat.
Allerdings wurde die Homepage bisher nicht aktualisiert.
Li Mu und Alex Smola gründeten 2016 ein Unternehmen für Datenanalysealgorithmen namens Marianas Labs.
Zu dieser Zeit war Li Mu CTO und Mitbegründer.
Li Mu erwähnte einmal in dem Artikel „Die fünf Jahre der Promotion“, dass
Die damalige Popularität von Deep Learning dazu führte, dass Start-up-Unternehmen kontinuierlich mit riesigen Geldsummen akquiriert wurden .
Alex arbeitete lange Zeit mit Hunderttausenden von Angel-Investitionen zusammen. Alex schrieb Crawler und er leitete das Modell selbst und verkaufte es später an 1-Page, ein kleines börsennotiertes Unternehmen.
Man kann sagen, dass sich der Meister und der Lehrling zum ersten Mal an der Carnegie Mellon University (CMU) trafen.
Im September 2012 ging Li Mu an die CMU, um bei Alex Smola zu studieren.
Damals arbeitete Alex noch bei Google und es gab keine Finanzierung, also überließen sie ihn Dave Andersen. Daher hatte Li Mu zwei Mentoren, einen für maschinelles Lernen und einen für verteilte Systeme.
In der ersten Jahreshälfte an der CMU unterhielt sich Li Mu jede Woche eine Stunde lang mit zwei Mentoren.
Da die beiden Lehrer sehr unterschiedliche Stile haben und Alex sehr schnell reagiert, ist es schwierig, seinen Rhythmus einzuhalten. Wenn Sie Ihre Ideen erklären möchten, müssen Sie mehr Hausaufgaben machen.
Und Dave wird Li Mu helfen, etwas gründlich zu verstehen, ohne viele Ideen zu liefern.
Unter der Anleitung zweier Mentoren wuchs Li Mu schnell heran.
In seinem zweiten Studienjahr an der CMU, während Yu Kai und andere Deep Learning betrieben, schloss sich auch Li Mu diesem Forschungsboom an.
Aufgrund seines Interesses an verteilten Deep-Learning-Frameworks entschied er sich für die Zusammenarbeit mit Chen Tianqi und nutzte CXXNet als Ausgangspunkt für Deep-Learning-bezogene Projekte.
Als die beiden gemeinsam das verteilte Startskript xgboost schrieben, stellten sie fest, dass das Lesen von Dateien von mehreren Projekten verwendet werden kann.
Um das Rad nicht neu erfinden zu müssen, haben Li Mu und Chen Tianqi gemeinsam eine Organisation namens DMLC auf Github gegründet und anschließend das erfolgreiche MXNet gegründet.
Im Juli 2016 kam Alex zu Amazon. Gleichzeitig wechselte Li Mu über MXNet als Teilzeitangestellter zu Amazon und entschied sich, nach seinem Abschluss zu bleiben.
Im Jahr 2019 hielten der Meister und der Lehrling auch gemeinsam Vorlesungen an der UC Berkeley.
Im Jahr 2021 werden die beiden außerdem gemeinsam „Practical Machine Learning“ an der Stanford University unterrichten.
Es ist erwähnenswert, dass das Buch „Hands-On Deep Learning“ von Li Mu, Aston Zhang, einem Doktor der Informatik an der University of Illinois in Urbana-Champaign, und geschrieben wurde sein Mentor Alex.
Dieses Buch ist seit seiner Veröffentlichung sehr beliebt geworden. Als einer der Autoren von MXNet wurde Li Mus „Hands-On Deep Learning“ ebenfalls mit dem MXNet-Framework geschrieben
Die multimodale Richtung ist das, was Li Yan schon lange erreichen wollte. Li Mu folgte seinem Mentor, um ein Unternehmen zu gründen, was möglicherweise in gewissem Maße von der Popularität von ChatGPT beeinflusst wurde.
Der Wettbewerb zwischen inländischen Unternehmen in der KI-Modellebene hat begonnen, sich zu verschärfen. Die aktuelle große Modellbahn ist überfüllt mit Spielern aus allen Gesellschaftsschichten, darunter die Giganten, großen Bosse, Rückkehrer/Führungskräfte großer Fabriken, kleine Start-ups im Übergang, Professoren und Sojasaucen-Fraktionen.
Am 13. Februar trat Wang Huiwen, der sich zwei Jahre lang aus Meituan zurückgezogen hatte, mit einer „AI Hero List“ an die Öffentlichkeit zurück und sagte, dass er 50 Millionen US-Dollar ausgeben würde, um „Kapital in die Gruppe zu bringen“ und „Position, Gehalt oder Titel sind mir egal, ich möchte nur ein Team bilden.“
Nachdem Wang Huiwen den Ticketpreis für große Model-Startups auf 50 Millionen US-Dollar angehoben hatte, verkündete Li Zhiwen, der Gründer von „Mobvoi“, offiziell das Ende des großen Model-Wettbewerbs.
... 36 Krypton gibt zu, dass er schnelle Vorbereitungen trifft.
Am 26. Februar veröffentlichte Zhou Bowen, der Gründer und Chefwissenschaftler von Xianyuan Technology, ebenfalls eine Nachricht, dass er Partner für den Aufbau der chinesischen Version von ChatGPT rekrutiert.
Der jüngste Anstieg verschiedener Nachfragen hat gezeigt, dass der potenzielle Markt für im Inland hergestellte Produkte der künstlichen Intelligenz überraschend groß ist.
Die Explosion von ChatGPT bedeutet, dass die Singularität angekommen ist. Sie hat tiefere und tiefere Veränderungen ausgelöst. Die neue Generation der KI wird die physische Welt und die Informationswelt integrieren, um einen geschlossenen Kreislauf von Wissen, Berechnungen und zu realisieren Argumentation.
In nur zwei Tagen wurde bekannt, dass zwei große Jungs ihr Geschäft aufgegeben und eine große Modellbahn eröffnet hatten. Die von den heimischen Giganten vorhergesagten Pressekonferenzen werden in wenigen Monaten stattfinden.
In diesem KI-Verfolgungswettbewerb mit großem KI-Modell, der seit Anfang des Jahres gestartet wurde, werden wir möglicherweise bald einige Spieler bis zur Ziellinie sprinten sehen.
Das obige ist der detaillierte Inhalt vonDer große Meister Li Mu und der Kuaishou-Veteran Li Yan wurden entlarvt und wechselten zu großen Models, nachdem sie ihre Jobs aufgegeben hatten. ChatGPT löste einen Boom im KI-Unternehmertum aus. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!