Table des matières

Le patron de Kuaishou, Li Yan, a démarré une entreprise et s'est lancé dans la multimodalité

Maître et apprenti en un : écrire un livre, démarrer une entreprise, démarrer une autre entreprise

Qui d'autre est sur la voie des grands modèles ?

Maison

Le grand maître Li Mu et le vétéran de Kuaishou, Li Yan, ont été exposés et sont passés à de grands modèles après avoir quitté leur emploi. ChatGPT a déclenché un boom de l'entrepreneuriat en IA.

Le grand maître Li Mu et le vétéran de Kuaishou, Li Yan, ont été exposés et sont passés à de grands modèles après avoir quitté leur emploi. ChatGPT a déclenché un boom de l'entrepreneuriat en IA.

王林

May 17, 2023 am 10:34 AM

ai 模型

Récemment, les géants de l'Internet ont rejoint la piste du grand modèle.

Hier, la nouvelle que Maître Li Mu a quitté Amazon pour travailler sur une maquette à grande échelle, comme le tonnerre, a explosé sur tous les réseaux sociaux.

Suite à cela, il a été révélé aujourd'hui que la nouvelle société créée par l'ancien patron principal de Kuaishou AI, Li Yan après avoir quitté Kuaishou en 2022, fabrique également de grands modèles.

De toute évidence, depuis que ChatGPT a permis au monde de voir les scénarios d'application de l'IA, la concurrence dans la couche de modèle d'IA entre les entreprises nationales a commencé à s'intensifier.

Le patron de Kuaishou, Li Yan, a démarré une entreprise et s'est lancé dans la multimodalité

Li Yan a créé la société d'IA « Yuanshi Technology » au second semestre 2022, menant principalement la recherche et le développement de grands modèles multimodaux.

Le grand maître Li Mu et le vétéran de Kuaishou, Li Yan, ont été exposés et sont passés à de grands modèles après avoir quitté leur emploi. ChatGPT a déclenché un boom de lentrepreneuriat en IA.

Li Yan est un ancien employé de Kuaishou avec un numéro d'emploi d'environ 75, et est également la figure centrale de la recherche et du développement de la technologie d'IA de Kuaishou.

En novembre 2015, avec le soutien de Su Hua, alors PDG de Kuaishou, Li Yan a créé le premier groupe interne de département d'apprentissage profond DL (Deep Learning), dans le but de construire des modèles d'algorithmes pour détecter les contenus vidéo illégaux afin d'identifier .

Par la suite, Kuaishou avait davantage besoin de compréhension du contenu vidéo. En 2016, Li Yan a changé le nom de l'équipe du groupe DL en groupe MMU (Compréhension multimédia, compréhension du contenu multimédia). En plus de résoudre les problèmes de conformité en matière de sécurité, elle s'est également lancée dans la recherche et le développement de modèles d'algorithmes sous diverses formes. tels que la voix, le texte et les images.

Lors de la conférence CNCC 2018, Li Yan a prononcé un discours intitulé "Production et compréhension de contenu multimodal", soulignant l'importance de la technologie de modèle multimodal :

Changer la façon dont l'interaction homme-machine La méthode
facilite la distribution de l'information plus efficace

Prenons comme exemple les courtes vidéos que nous regardons souvent. En plus des informations multimodales telles que le visuel, l'auditif et le texte, le comportement des utilisateurs est également une autre donnée modale.

De cette manière, la vidéo elle-même et le comportement de l'utilisateur constituent ensemble un problème multimodal très complexe.

Le but de la recherche multimodale est de rendre l'interaction homme-machine de plus en plus naturelle et confortable.

Cependant, la recherche multimodale est assez difficile.

D'une part, nous devons faire face au problème de l'écart sémantique d'une modalité unique et au problème de l'écart hétérogène de la façon de modéliser de manière exhaustive les données de différentes modalités, d'autre part, nous devons également résoudre la difficulté de construire des données multiples ; -ensembles de données modaux entraînant des problèmes de données manquantes.

À cette époque, de nombreuses études dans la communauté universitaire restaient encore dans le domaine monomodal, mais Li Yan croyait fermement que la multimodalité deviendra une direction de recherche plus précieuse à l'avenir.

L'expérience à Kuaishou a donné à Li Yan une compréhension approfondie de l'écosystème de l'IA dans de courtes vidéos. En 2021, il a choisi de quitter Kuaishou.

Au second semestre 2022, il a créé Yuanshi Technology. Selon la vérification exclusive de 36Kr, l'objectif principal de Yuanshi Technology est la recherche et le développement de grands modèles multimodaux.

Maître et apprenti en un : écrire un livre, démarrer une entreprise, démarrer une autre entreprise

Et hier, la nouvelle selon laquelle Maître Li Mu était soupçonné d'avoir rejoint une grande entreprise de mannequins a également instantanément inondé les réseaux sociaux.

Selon le compte public "Dear Data", Alex Smola, le "père du serveur de paramètres", a quitté Amazon en février de cette année et a fondé une société d'intelligence artificielle appelée Boson.ai.

Quant à la présentation de cette nouvelle société, il n'y a pas beaucoup d'informations, et la page officielle est toujours en construction.

Lien : https://boson.ai/

Pour être sûr, nous devons réaliser des projets liés aux grands modèles.

Selon la page LinkedIn d'Alex, "Nous faisons quelque chose de grand. Si vous êtes intéressé par le modèle de base évolutif, veuillez me contacter."

Il est à noter que sur le GitHub de l'entreprise. page d'accueil, le scientifique en chef d'Amazon, Li Mu, a également contribué au code.

Par conséquent, on suppose que Li Mu a rejoint Boson.ai et a démarré une entreprise avec son mentor.

Cependant, sa page d'accueil n'a pas été mise à jour jusqu'à présent.

Li Mu et Alex Smola ont fondé une société d'algorithmes d'analyse de données appelée Marianas Labs en 2016.

À cette époque, Li Mu était le CTO et co-fondateur.

Li Mu a mentionné un jour dans l'article "Les cinq années de doctorat" que

La popularité de l'apprentissage profond à cette époque a conduit à l'acquisition continue de start-ups avec d'énormes sommes d'argent .

Alex a travaillé avec lui pendant longtemps avec des centaines de milliers d'investissements providentiels. Alex a écrit des robots d'exploration et il a géré le modèle lui-même, puis l'a vendu à 1-Page, une petite société cotée.

On peut dire que le maître et l'apprenti se sont rencontrés pour la première fois à l'Université Carnegie Mellon (CMU).

En septembre 2012, Li Mu est allée à la CMU pour étudier avec Alex Smola.

À cette époque, Alex travaillait encore chez Google et il n'y avait pas de financement, alors ils l'ont laissé à Dave Andersen. Par conséquent, Li Mu avait deux mentors, l'un s'occupant de l'apprentissage automatique et l'autre des systèmes distribués.

Au cours du premier semestre à la CMU, Li Mu discutait avec deux mentors pendant une heure chaque semaine.

Comme les deux instructeurs ont des styles très différents, et qu'Alex réagit très vite, il est difficile de suivre son rythme. Si vous souhaitez expliquer vos idées, vous devez faire plus de devoirs.

Et Dave aidera Li Mu à comprendre quelque chose à fond sans donner beaucoup d'idées.

Sous la direction de deux mentors, Li Mu a grandi rapidement.

Au cours de sa deuxième année d'études à la CMU, tandis que Yu Kai et d'autres faisaient du deep learning, Li Mu a également rejoint ce boom de la recherche.

En raison de son intérêt pour les frameworks d'apprentissage profond distribués, il a choisi de coopérer avec Chen Tianqi, en utilisant CXXNet comme point de départ pour réaliser des projets liés à l'apprentissage profond.

Lorsque tous deux ont écrit ensemble le script de démarrage distribué xgboost, ils ont découvert que la lecture de fichiers pouvait être utilisée par plusieurs projets.

Afin d'éviter de réinventer la roue, Li Mu et Chen Tianqi ont travaillé ensemble pour créer une organisation appelée DMLC sur Github, puis ont créé le MXNet qui a ensuite connu un succès.

En juillet 2016, Alex a rejoint Amazon. Dans le même temps, Li Mu a emmené MXNet rejoindre Amazon en tant qu'employé à temps partiel et a choisi de rester après l'obtention de son diplôme.

Au cours de l'année 2019, le maître et l'apprenti ont également donné des conférences ensemble à l'UC Berkeley.

En 2021, les deux enseigneront également ensemble le "Practical Machine Learning" à l'Université de Stanford.

Il convient de mentionner que le livre "Hands-On Deep Learning" a été écrit par Li Mu, Aston Zhang, docteur en informatique de l'Université de l'Illinois à Urbana-Champaign, et son mentor Alex.

Ce livre est devenu très populaire depuis sa sortie. En tant que l'un des auteurs de MXNet, le « Hands-On Deep Learning » de Li Mu est également écrit en utilisant le framework MXNet

Qui d'autre est sur la voie des grands modèles ?

La direction multimodale est ce que Li Yan souhaite faire depuis longtemps. Li Mu a suivi son mentor pour démarrer une entreprise, qui a peut-être été affectée dans une certaine mesure par la popularité de ChatGPT.

La concurrence entre les entreprises nationales dans la couche de modèle d'IA a commencé à s'intensifier. Le modèle actuel à grande échelle est rempli d'acteurs de tous horizons, y compris des géants, des grands patrons, des rapatriés/dirigeants de grandes usines, des petites startups en transition, des professeurs et des factions de sauce soja.

Le 13 février, Wang Huiwen, qui avait pris sa retraite de Meituan depuis 2 ans, est revenu aux yeux du public avec une « Liste des héros de l'IA », affirmant qu'il dépenserait 50 millions de dollars pour « apporter des capitaux au groupe » et "Je me fiche du poste, du salaire ou du titre, je veux juste former une équipe."

Après que Wang Huiwen ait augmenté le prix du billet pour démarrer une grande entreprise de mannequins à 50 millions de dollars américains, Li Zhiwen, le fondateur de "Mobvoi", a officiellement annoncé la fin du concours de grands mannequins.

Li Zhiwen a dirigé l'équipe pour former le grand modèle UCLAL en 2020

De plus, l'ancien PDG de Sogou, Wang Xiaochuan, a également publié une vague annonce selon laquelle il était sur le point d'entrer sur le champ de bataille de « l'OpenAI chinoise » et a fait rapport à 36 Krypton admet qu'il se prépare rapidement.

Le 26 février, Zhou Bowen, fondateur et scientifique en chef de Xianyuan Technology, a également publié un message disant qu'il recrutait des partenaires pour créer la version chinoise de ChatGPT.

La récente augmentation des demandes diverses a montré que le marché potentiel des produits d'intelligence artificielle générés au niveau national est étonnamment vaste.

L'explosion de ChatGPT signifie que la singularité est arrivée. Elle a déclenché des changements de niveau inférieur et plus profonds. La nouvelle génération d'IA intégrera le monde physique et le monde de l'information pour réaliser une boucle fermée de connaissances, de calcul et d'information. raisonnement.

En seulement deux jours, il a été révélé que deux grands noms avaient quitté leur entreprise et ouvert une grande piste de modélisme. Les conférences de presse annoncées par les géants nationaux auront lieu d’ici quelques mois.

Ainsi, dans cette compétition de poursuite nationale sur grand modèle d'IA qui a débuté depuis le début de l'année, nous pourrions bientôt voir certains concurrents sprinter jusqu'à la ligne d'arrivée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Combien de temps faut-il pour battre Split Fiction?

1 Il y a quelques mois By DDD

R.E.P.O. Meilleurs paramètres graphiques

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

1 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7403

Tutoriel Java

1630

Tutoriel CakePHP

1358

Tutoriel Laravel

1268

Tutoriel PHP

1218

Afficher plus

Related knowledge

Comment réaliser l'effet d'éléments d'entrée élevés mais un texte élevé en bas? Apr 04, 2025 pm 10:27 PM

Comment atteindre la hauteur de l'élément d'entrée est très élevé mais le texte est situé en bas. Dans le développement frontal, vous rencontrez souvent certaines exigences de réglage du style, telles que la fixation d'une hauteur ...

Comment afficher correctement le 'Jingnan Mai Round Body' installé localement sur la page Web? Apr 05, 2025 pm 10:33 PM

En utilisant récemment des fichiers de police installés localement dans les pages Web, j'ai téléchargé une police gratuite à partir d'Internet et je l'ai installée avec succès dans mon système. Maintenant...

Où obtenir le matériel pour la production de pages H5 Apr 05, 2025 pm 11:33 PM

Les principales sources de matériel H5 Page sont: 1. Site Web de matériel professionnel (payé, de haute qualité, Copyright clair); 2. Matériel fait maison (unicité élevée, mais qui prend du temps); 3. Bibliothèque de matériaux open source (gratuit, doit être soigneusement dépisté); 4. site Web d'image / vidéo (le droit d'auteur vérifié est requis). De plus, le style de matériau unifié, l'adaptation de la taille, le traitement de la compression et la protection des droits d'auteur sont des points clés auxquels il faut faire attention.

Comment sélectionner un élément enfant avec l'élément de nom de première classe via CSS? Apr 05, 2025 pm 11:24 PM

Lorsque le nombre d'éléments n'est pas fixé, comment sélectionner le premier élément enfant du nom de classe spécifié via CSS. Lors du traitement de la structure HTML, vous rencontrez souvent différents éléments ...

La production de pages H5 nécessite-t-elle une maintenance continue? Apr 05, 2025 pm 11:27 PM

La page H5 doit être maintenue en continu, en raison de facteurs tels que les vulnérabilités du code, la compatibilité des navigateurs, l'optimisation des performances, les mises à jour de sécurité et les améliorations de l'expérience utilisateur. Des méthodes de maintenance efficaces comprennent l'établissement d'un système de test complet, à l'aide d'outils de contrôle de version, de surveiller régulièrement les performances de la page, de collecter les commentaires des utilisateurs et de formuler des plans de maintenance.

Comment utiliser CSS et Flexbox pour implémenter la disposition réactive des images et du texte à différentes tailles d'écran? Apr 05, 2025 pm 06:06 PM

Implémentation de dispositions réactives à l'aide de CSS lorsque nous voulons implémenter des modifications de mise en page sous différentes tailles d'écran dans la conception Web, CSS ...

Comment utiliser CSS Flexbox pour obtenir une disposition réactive avec un rapport de hauteur de 2: 5: 3? Apr 04, 2025 pm 10:36 PM

En utilisant la disposition élastique CSS pour obtenir des proportions de hauteur personnalisées et s'adapter à différentes résolutions, cet article explorera comment utiliser la disposition élastique CSS (Flexbox) pour obtenir un rapport de hauteur ...

Réglage flex: 1 1 0 Quelle est la différence entre le réglage de la Flex-Basis et le non-réglage Flex-Basis? Apr 05, 2025 am 09:39 AM

La différence entre Flex: 110 dans la disposition flexible et le bass de flex non réglée dans la disposition Flex, comment régler Flex ...

See all articles