À partir de la semaine prochaine, les actualités hebdomadaires sur l'IA seront mises à jour quotidiennement - la rubrique quotidienne des actualités sur l'IA. Tout le monde est invité à continuer à suivre l'actualité de Wall Street et la recherche sur la sagesse.
Nouvelles actualités IA cette semaine - nouvelle perspective de l'actualité
Actualités hebdomadaires
Résumé des points clés cette semaine :
1. Ma Huateng a déclaré que l'IA est comparable à la révolution industrielle de l'énergie électrique ; Meituan étend le recrutement algorithmique et développe tranquillement de grands modèles ;
2. OpenAI lance la version iOS de chatGPT, ouvrant 70 plug-ins aux utilisateurs Plus
3. Meta lance la puce AI - MTIA, qui mettra 25 ans à sortir. Elle utilisera toujours le GPU NVIDIA.
4. Une nouvelle étape dans le dessin AI-DragGAN permet à un éléphant de se retourner et à une voiture de se « convertir » en un seul clic.
5. L'intelligence incarnée crée la perception active de l'IA, la prochaine vague de l'intelligence artificielle.
6. Yuncong Technology lance le modèle à grande échelle. La voie de commercialisation dans le domaine vertical est une opportunité pour les modèles nationaux à grande échelle.
7. Technologie noire de l'IA - Vous pouvez découvrir « Beyond the Horizon » de Disney à la maison ; le « Spider-Man » semi-mécanique bouleverse la perception de l'interaction homme-machine.
Voir l'actualité sous un nouvel angle
Lors de l'assemblée générale de Tencent en 2023, Ma Huateng a déclaré : « Au début, tout le monde pensait que l'IA était une opportunité unique pour Internet, mais maintenant la compréhension de l'IA est devenue une opportunité de développement centenaire, qui peut être comparée à la révolution industrielle de l'énergie électrique. " Tencent est également actuellement plongé dans la recherche et le développement de la technologie de l'IA, mais nous ne sommes pas avides de succès à court terme. À l'avenir, nous créerons plus de valeur. l'écologie des applications et des contenus. Nous ne nous concentrerons pas uniquement sur le côté to-C, mais accorderons également de l'importance aux opportunités du côté to-B.
De plus, Meituan développe secrètement de grands modèles et aménage le terrain depuis début mars, récemment, l'équipe d'algorithmes s'agrandit également et prévoit également de créer un « département de plate-forme » distinct pour aider les grands modèles de Meituan. passer des formulaires de commercialisation spécifiques.
Jianzhi Research estime : La concurrence actuelle entre les grands modèles est très féroce, et l'émergence de nombreux grands modèles open source a accéléré la vitesse de cette involution. Cependant, le problème avec les grands modèles open source est qu'ils sont difficiles à commercialiser et sont principalement utilisés pour la recherche universitaire. Cependant, si de grands modèles avancés et fermés à l'étranger sont utilisés dans certains domaines clés, il y aura des risques de sécurité.
La tendance au développement de grands modèles nationaux réside donc dans la richesse des bibliothèques de prédictions chinoises, de solides avantages de localisation et une sécurité et une confidentialité élevées. La demande du marché pour les grands modèles spécifiques à la Chine sera très élevée à l'avenir.
Ce qui mérite une attention particulière, c'est la valeur commerciale de la combinaison de grands modèles et d'applications. OpenAI, Microsoft et Google ont successivement commencé à étendre leur territoire écologique. C'est également la voie inévitable pour que les résultats de la R&D nationale soient finalement réalisés et génèrent une plus grande valeur commerciale.
Breaking Release
1. OpenAI lance la version iOS de chatGPT, ouvrant 70 plug-ins aux utilisateurs Plus
OpenA a officiellement lancé la version iOS de chatGPT cette semaine. Les utilisateurs doivent utiliser iOS 16.1 ou une version supérieure du système d'exploitation. Et promet qu'une version Android sortira prochainement.
ChatGPT sur le téléphone mobile prend en charge la synchronisation des enregistrements de l'historique des utilisateurs sur tous les appareils et intègre également le système de reconnaissance vocale open source Whisper d'OpenAI. Les utilisateurs peuvent saisir du contenu par la voix, effectuer des questions et des réponses, effectuer des traductions linguistiques, un coaching pédagogique et générer automatiquement du texte. .
De plus, ChatGPT ouvre la fonction de mise en réseau aux utilisateurs PLUS, permettant l'utilisation de 70 plug-ins tiers.
Jianzhi Research estime : Qu'il s'agisse de la promotion d'applications mobiles ou de l'utilisation de plug-ins tiers ouverts, ce sont les efforts d'OpenAI pour accroître la fidélité des utilisateurs et atteindre davantage la pénétration des utilisateurs.
L'ouverture de la version mobile augmentera considérablement la fréquence d'utilisation des utilisateurs, car elle est plus pratique et plus facile à utiliser que la version PC. Depuis le lancement de ChatGPT, les utilisateurs souhaitent utiliser ChatGPT sur les appareils mobiles. La valeur commerciale et le volume actif quotidien de ChatGPT atteindront à nouveau de nouveaux sommets avec l'ouverture du terminal mobile. De plus, à mesure que le nombre de visites augmente, la demande en puissance de calcul va encore augmenter.
De plus, bien que les plug-ins tiers ne soient actuellement ouverts qu'aux utilisateurs payants PLUS, à en juger par le degré actuel d'involution de l'IA, ils seront bientôt entièrement gratuits.
2. Meta lance la puce dédiée à l'IA-MTIA
MTIA est une puce programmable conçue pour la formation et l'inférence. Son lancement a considérablement amélioré la puissance matérielle de Meta dans le domaine de l'intelligence artificielle. En fin de compte, la concurrence entre les géants de la technologie ne peut pas échapper au matériel de base. Surtout à l'ère du développement de l'IA, le niveau de puissance de calcul est la pierre angulaire du développement. Si la puissance de calcul ne peut pas être maîtrisée, le processus de développement sera inévitablement contrôlé par « les autres ». .
Mais MTIA a encore beaucoup de marge d'optimisation, et il devrait attendre 25 ans avant de sortir. En termes de tests de performances NNP et GPU, le MTIA est plus performant sur les modèles de complexité faible et moyenne, mais il est encore loin derrière le GPU sur les modèles de complexité élevée.
Zhizhi Research estime : Meta développe des puces IA sur le long terme. Après tout, les puces sont la principale puissance entre nos mains. Cependant, la route vers le développement de puces hautes performances est également très longue. achevé dès 2020. c'est parti. À l'heure actuelle, Meta utilisera toujours les GPU NVIDIA. Après tout, en 2022, Meta vient de réaliser une conception révolutionnaire pour son centre de données afin d'introduire les GPU NVIDIA. À l'avenir, il s'appuiera principalement sur le centre de calcul RSC pour développer l'IA.
3. Une nouvelle étape dans le dessin AI - DragGAN réalise toutes les imaginationsDragGAN brise complètement la position exclusive du modèle Diffusion dans le domaine du dessin IA. L'article intitulé "Drag Your GAN" a fait exploser le cercle de dessin de l'IA. L'article a été publié conjointement par des chercheurs du MPII, du MIT, de Penn State, de Google et d'autres institutions, et a été accepté par SIGGRAPH2023.
Ce modèle peut répondre à presque tous les besoins de retouche photo. Il peut modifier la forme, les détails et même la direction et la disposition des objets. Il peut être appelé Photoshop au niveau d'une bombe nucléaire.
Les utilisateurs doivent uniquement définir quelques points d'opération (points rouges) et points cibles (points bleus) sur la photo, puis glisser-déposer pour générer une nouvelle image.
Jizhi Research estime que : L'émergence de DragGAN montre que la formation automatique dans l'apprentissage de l'image a atteint un nouveau niveau. Il convient de noter que DragGAN a des capacités de généralisation plus puissantes et peut créer des images qui dépassent les données d'entraînement. Par exemple, la forme de la gueule du lion a été complètement modifiée. Il s'agit essentiellement d'un contenu nouvellement généré, plutôt que de la modification que les gens pensaient à l'origine. .fonction graphique.
Par rapport aux méthodes précédentes, DragGAN ne s'appuie pas sur la modélisation ou sur des réseaux auxiliaires dans des domaines spécifiques, mais utilise un cadre général, utilise le GAN pour identifier la qualité de l'image et utilise le suivi de points pour compléter la fonction de déformation de l'image. Avec cette fonction puissante, les vidéastes et les retoucheurs de photos s'amuseront beaucoup.
4. L'intelligence incarnée crée la perception active de l'IA, la prochaine vague de l'intelligence artificielle.
Lors de la conférence ITF World 2023 sur les semi-conducteurs, le PDG de NVIDIA, Jensen Huang, a fait une autre déclaration audacieuse selon laquelle la prochaine vague d'intelligence artificielle sera l'intelligence incorporée.
Jianzhi Research estime que : La valeur de l'IA apportée par l'intelligence incarnée est bien supérieure à celle des robots humanoïdes. La plus grande caractéristique de l’intelligence incarnée est qu’elle peut percevoir de manière autonome le monde physique du point de vue du protagoniste et utiliser un chemin de pensée anthropomorphique pour apprendre, donnant ainsi un retour comportemental attendu par les humains, au lieu d’attendre passivement que les données soient alimentées. Parmi les cinq principaux sens humains, la vision représente plus de 80 % des informations acquises, et il est également très important que les machines comprennent le langage humain. Par conséquent, la vision industrielle et les grands modèles multimodaux sont les deux clés pour débloquer la machine. -apprentissage de la perception. Pour plus de détails, consultez Qu'est-ce que « l'intelligence incorporée » populaire de NVIDIA ? La valeur de l’IA est bien supérieure à celle des robots.
5. Yuncong Technology lance le grand modèle de Congrong
Yuncong Technology, une société de plateforme d'intelligence artificielle, a lancé le modèle Congrong à Guangzhou et a démontré ses capacités de base telles que le dialogue, la programmation, la lecture et la réponse à de vraies questions lors de l'examen d'entrée au lycée. Le grand modèle est actuellement en phase de tests internes. Ce modèle est un grand modèle vincentien et ne peut pas encore remplir les fonctions des grands modèles multimodaux tels que les diagrammes vincentiens.
Performances lors du test ouvert : la vitesse de réponse est rapide, mais la précision du contenu doit être améliorée. De plus, l’actualité de la base de données est relativement faible, puisqu’elle date encore de 21 ans. De plus, les performances du modèle en mathématiques et en capacités de raisonnement n’ont pas encore atteint les attentes.
Jianzhi Research estime : L'avantage des grands modèles nationaux est que la richesse du corpus chinois est bien supérieure à celle des grands modèles avancés étrangers. Bien qu'il soit difficile de rattraper ChatGPT en termes de leadership, le Congrong Big Model prendra la tête du développement d'applications pour les industries verticales à l'avenir, en particulier dans le développement de modèles industriels exclusifs dans les domaines de la finance, des affaires gouvernementales, et la fabrication, et s'engage dans la commercialisation des modèles Realize.
Technologie IA noire
1. Vous pouvez découvrir « Au-delà de l’horizon » de Disney à la maison
Le développeur étranger Nils Bakker a créé avec succès un système de « transmission d'espace virtuel » à l'aide de ChatGPT, en utilisant Unreal Engine 5.1 + ChatGPT + l'API Google Maps 3D Tiles. Les utilisateurs n'ont qu'à saisir l'emplacement et le système vous emmènera du point de vue de la première personne. . Surplombant les magnifiques paysages du monde entier, c'est le moment de ressentir la joie de survoler l'horizon chez soi.
Combinez les API de Google 3D Tiles et de ChatGPT, puis utilisez les capacités d'Unreal Engine pour permettre aux utilisateurs de vivre une expérience immersive de voyage dans l'espace. Vous pouvez désormais ressentir le charme de survoler l’horizon tout en étant allongé chez vous.
Jianzhi Research estime que : L'IA en est encore aux premiers stades de développement de l'industrie, l'imagination et la créativité sont très importantes, et les pistes de l'industrie et les opportunités commerciales surgiront comme des champignons après la pluie.
2. Le cyborg "Spider-Man" est là
La société japonaise de robotique Jizai Arms a conçu un système de membres robotiques en forme d'araignée qui permet aux humains d'avoir des bras robotiques librement contrôlables. Le système se compose de six bras pouvant être contrôlés par l'utilisateur qui les porte. Jusqu'à quatre bras robotiques peuvent être installés. Ce qui est remarquable, c'est que ce système change la façon dont se déroule l'interaction homme-machine.
La prothèse est très flexible et peut effectuer une variété de tâches. Ses applications vont des entrepôts aux salles d'opération des hôpitaux. Elle peut contribuer à améliorer la qualité de vie des personnes handicapées à l'avenir.
Jianzhi Research estime que : L'« intégration » de bras robotiques et de personnes réelles ouvre l'espace d'imagination de l'intégration homme-machine et rafraîchit la limite supérieure de la compréhension du développement des robots. Il y en aura davantage dans le futur.
Que regarder la semaine prochaine
Dans l'attente du premier grand modèle open source d'OpenAI, peut-il réécrire le statut de Meta en tant que roi de l'open source ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!