Récemment, les géants de l'Internet ont rejoint la piste du grand modèle.
Hier, la nouvelle que Maître Li Mu a quitté Amazon pour travailler sur une maquette à grande échelle, comme le tonnerre, a explosé sur tous les réseaux sociaux.
Suite à cela, il a été révélé aujourd'hui que la nouvelle société créée par l'ancien patron principal de Kuaishou AI, Li Yan après avoir quitté Kuaishou en 2022, fabrique également de grands modèles.
De toute évidence, depuis que ChatGPT a permis au monde de voir les scénarios d'application de l'IA, la concurrence dans la couche de modèle d'IA entre les entreprises nationales a commencé à s'intensifier.
Li Yan a créé la société d'IA « Yuanshi Technology » au second semestre 2022, menant principalement la recherche et le développement de grands modèles multimodaux.
Li Yan est un ancien employé de Kuaishou avec un numéro d'emploi d'environ 75, et est également la figure centrale de la recherche et du développement de la technologie d'IA de Kuaishou.
En novembre 2015, avec le soutien de Su Hua, alors PDG de Kuaishou, Li Yan a créé le premier groupe interne de département d'apprentissage profond DL (Deep Learning), dans le but de construire des modèles d'algorithmes pour détecter les contenus vidéo illégaux afin d'identifier .
Par la suite, Kuaishou avait davantage besoin de compréhension du contenu vidéo. En 2016, Li Yan a changé le nom de l'équipe du groupe DL en groupe MMU (Compréhension multimédia, compréhension du contenu multimédia). En plus de résoudre les problèmes de conformité en matière de sécurité, elle s'est également lancée dans la recherche et le développement de modèles d'algorithmes sous diverses formes. tels que la voix, le texte et les images.
Lors de la conférence CNCC 2018, Li Yan a prononcé un discours intitulé "Production et compréhension de contenu multimodal", soulignant l'importance de la technologie de modèle multimodal :
Prenons comme exemple les courtes vidéos que nous regardons souvent. En plus des informations multimodales telles que le visuel, l'auditif et le texte, le comportement des utilisateurs est également une autre donnée modale.
De cette manière, la vidéo elle-même et le comportement de l'utilisateur constituent ensemble un problème multimodal très complexe.
Le but de la recherche multimodale est de rendre l'interaction homme-machine de plus en plus naturelle et confortable.
Cependant, la recherche multimodale est assez difficile.
D'une part, nous devons faire face au problème de l'écart sémantique d'une modalité unique et au problème de l'écart hétérogène de la façon de modéliser de manière exhaustive les données de différentes modalités, d'autre part, nous devons également résoudre la difficulté de construire des données multiples ; -ensembles de données modaux entraînant des problèmes de données manquantes.
À cette époque, de nombreuses études dans la communauté universitaire restaient encore dans le domaine monomodal, mais Li Yan croyait fermement que la multimodalité deviendra une direction de recherche plus précieuse à l'avenir.
L'expérience à Kuaishou a donné à Li Yan une compréhension approfondie de l'écosystème de l'IA dans de courtes vidéos. En 2021, il a choisi de quitter Kuaishou.
Au second semestre 2022, il a créé Yuanshi Technology. Selon la vérification exclusive de 36Kr, l'objectif principal de Yuanshi Technology est la recherche et le développement de grands modèles multimodaux.
Et hier, la nouvelle selon laquelle Maître Li Mu était soupçonné d'avoir rejoint une grande entreprise de mannequins a également instantanément inondé les réseaux sociaux.
Selon le compte public "Dear Data", Alex Smola, le "père du serveur de paramètres", a quitté Amazon en février de cette année et a fondé une société d'intelligence artificielle appelée Boson.ai.
Quant à la présentation de cette nouvelle société, il n'y a pas beaucoup d'informations, et la page officielle est toujours en construction.
Lien : https://boson.ai/
Pour être sûr, nous devons réaliser des projets liés aux grands modèles.
Selon la page LinkedIn d'Alex, "Nous faisons quelque chose de grand. Si vous êtes intéressé par le modèle de base évolutif, veuillez me contacter."
Il est à noter que sur le GitHub de l'entreprise. page d'accueil, le scientifique en chef d'Amazon, Li Mu, a également contribué au code.
Par conséquent, on suppose que Li Mu a rejoint Boson.ai et a démarré une entreprise avec son mentor.
Cependant, sa page d'accueil n'a pas été mise à jour jusqu'à présent.
Li Mu et Alex Smola ont fondé une société d'algorithmes d'analyse de données appelée Marianas Labs en 2016.
À cette époque, Li Mu était le CTO et co-fondateur.
Li Mu a mentionné un jour dans l'article "Les cinq années de doctorat" que
La popularité de l'apprentissage profond à cette époque a conduit à l'acquisition continue de start-ups avec d'énormes sommes d'argent .
Alex a travaillé avec lui pendant longtemps avec des centaines de milliers d'investissements providentiels. Alex a écrit des robots d'exploration et il a géré le modèle lui-même, puis l'a vendu à 1-Page, une petite société cotée.
On peut dire que le maître et l'apprenti se sont rencontrés pour la première fois à l'Université Carnegie Mellon (CMU).
En septembre 2012, Li Mu est allée à la CMU pour étudier avec Alex Smola.
À cette époque, Alex travaillait encore chez Google et il n'y avait pas de financement, alors ils l'ont laissé à Dave Andersen. Par conséquent, Li Mu avait deux mentors, l'un s'occupant de l'apprentissage automatique et l'autre des systèmes distribués.
Au cours du premier semestre à la CMU, Li Mu discutait avec deux mentors pendant une heure chaque semaine.
Comme les deux instructeurs ont des styles très différents, et qu'Alex réagit très vite, il est difficile de suivre son rythme. Si vous souhaitez expliquer vos idées, vous devez faire plus de devoirs.
Et Dave aidera Li Mu à comprendre quelque chose à fond sans donner beaucoup d'idées.
Sous la direction de deux mentors, Li Mu a grandi rapidement.
Au cours de sa deuxième année d'études à la CMU, tandis que Yu Kai et d'autres faisaient du deep learning, Li Mu a également rejoint ce boom de la recherche.
En raison de son intérêt pour les frameworks d'apprentissage profond distribués, il a choisi de coopérer avec Chen Tianqi, en utilisant CXXNet comme point de départ pour réaliser des projets liés à l'apprentissage profond.
Lorsque tous deux ont écrit ensemble le script de démarrage distribué xgboost, ils ont découvert que la lecture de fichiers pouvait être utilisée par plusieurs projets.
Afin d'éviter de réinventer la roue, Li Mu et Chen Tianqi ont travaillé ensemble pour créer une organisation appelée DMLC sur Github, puis ont créé le MXNet qui a ensuite connu un succès.
En juillet 2016, Alex a rejoint Amazon. Dans le même temps, Li Mu a emmené MXNet rejoindre Amazon en tant qu'employé à temps partiel et a choisi de rester après l'obtention de son diplôme.
Au cours de l'année 2019, le maître et l'apprenti ont également donné des conférences ensemble à l'UC Berkeley.
En 2021, les deux enseigneront également ensemble le "Practical Machine Learning" à l'Université de Stanford.
Il convient de mentionner que le livre "Hands-On Deep Learning" a été écrit par Li Mu, Aston Zhang, docteur en informatique de l'Université de l'Illinois à Urbana-Champaign, et son mentor Alex.
Ce livre est devenu très populaire depuis sa sortie. En tant que l'un des auteurs de MXNet, le « Hands-On Deep Learning » de Li Mu est également écrit en utilisant le framework MXNet
La direction multimodale est ce que Li Yan souhaite faire depuis longtemps. Li Mu a suivi son mentor pour démarrer une entreprise, qui a peut-être été affectée dans une certaine mesure par la popularité de ChatGPT.
La concurrence entre les entreprises nationales dans la couche de modèle d'IA a commencé à s'intensifier. Le modèle actuel à grande échelle est rempli d'acteurs de tous horizons, y compris des géants, des grands patrons, des rapatriés/dirigeants de grandes usines, des petites startups en transition, des professeurs et des factions de sauce soja.
Le 13 février, Wang Huiwen, qui avait pris sa retraite de Meituan depuis 2 ans, est revenu aux yeux du public avec une « Liste des héros de l'IA », affirmant qu'il dépenserait 50 millions de dollars pour « apporter des capitaux au groupe » et "Je me fiche du poste, du salaire ou du titre, je veux juste former une équipe."
Après que Wang Huiwen ait augmenté le prix du billet pour démarrer une grande entreprise de mannequins à 50 millions de dollars américains, Li Zhiwen, le fondateur de "Mobvoi", a officiellement annoncé la fin du concours de grands mannequins.
Li Zhiwen a dirigé l'équipe pour former le grand modèle UCLAL en 2020
De plus, l'ancien PDG de Sogou, Wang Xiaochuan, a également publié une vague annonce selon laquelle il était sur le point d'entrer sur le champ de bataille de « l'OpenAI chinoise » et a fait rapport à 36 Krypton admet qu'il se prépare rapidement.
Le 26 février, Zhou Bowen, fondateur et scientifique en chef de Xianyuan Technology, a également publié un message disant qu'il recrutait des partenaires pour créer la version chinoise de ChatGPT.
La récente augmentation des demandes diverses a montré que le marché potentiel des produits d'intelligence artificielle générés au niveau national est étonnamment vaste.
L'explosion de ChatGPT signifie que la singularité est arrivée. Elle a déclenché des changements de niveau inférieur et plus profonds. La nouvelle génération d'IA intégrera le monde physique et le monde de l'information pour réaliser une boucle fermée de connaissances, de calcul et d'information. raisonnement.
En seulement deux jours, il a été révélé que deux grands noms avaient quitté leur entreprise et ouvert une grande piste de modélisme. Les conférences de presse annoncées par les géants nationaux auront lieu d’ici quelques mois.
Ainsi, dans cette compétition de poursuite nationale sur grand modèle d'IA qui a débuté depuis le début de l'année, nous pourrions bientôt voir certains concurrents sprinter jusqu'à la ligne d'arrivée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!