Points de la semaine
Wall Street Insights and Wisdom Research Perspective : Les GPU sont en grave pénurie et la demande de modules optiques et de PCB de stockage est forte.
Outre-mer :
- Google StyleDrop revient dans le domaine du dessin IA, avec de la créativité et un style plus contrôlable
;- Apple lancera la stratégie AIGC+MR et AI+XR deviendra le champ de bataille mobile de nouvelle génération ;
- L'équipe NVIDIA lance un grand modèle d'IA vidéo 3D, rendant la réalité virtuelle plus réaliste
;- Microsoft lancera Teams 2.0 à la fin de l'année, et le système d'exploitation lancera une attaque générale d'IA
;
Domestique
Une perspective de recherche inspirante
- Avec des politiques favorables dans de nombreux endroits, Pékin, Shanghai et Shenzhen ont successivement introduit des plans de développement de l'IA ;
- Tencent investit pour la première fois dans les grands modèles ! Les startups de l'IA sont à l'avant-garde
- L'assistant Alibaba Cloud AI « Tongyi Listening » est en version bêta publique, et la version mobile sera lancée plus rapidement que prévu
;- Base de données nationale entièrement auto-développée, Torsi Haibei a une forte demande dans les domaines financier et gouvernemental
;- Le grand modèle chinois de l'IA a lancé une gouvernance open source pour compléter l'attaque et la défense de l'IA contre « l'empoisonnement » et la « désintoxication »
;
Les GPU sont en grave pénurie et la demande de modules optiques et de PCB de stockage résonne.
OpenAI et Supermicro crient à NVIDIA que les GPU ne suffisent pas !
La plus grande plainte des clients d’OpenAI à l’heure actuelle est la fiabilité et la rapidité de l’API. Le PDG d'OpenAI, Sam Altman, a admis que la pénurie actuelle de GPU a forcé le report de nombreux projets à court terme. Les API de réglage fin et les produits à capacité dédiée sont tous limités par la disponibilité des GPU. Cependant, OpenAI fournira également une capacité dédiée pour fournir aux clients des copies privées des modèles, mais pour accéder à ce service, les clients doivent pré-engager 1 million de dollars.
Le fondateur et PDG de Supermicro, Liang Jianhou, a déclaré : La demande du marché pour l'IA est forte. La société étend sa capacité aux États-Unis, aux Pays-Bas et dans d'autres pays. Elle dispose également de bases de production de serveurs en Malaisie et au Japon et devrait en compter 4 000. unités à la fin de l'année. La capacité de production d'armoires a augmenté à 5 000 unités. Il a également déclaré à Huang Renxun que Nvidia devrait fournir plus de puces, même si cela est actuellement fourni, ce n'est pas suffisant.
Des recherches éclairées estiment :
Poussés par la demande d'IA générative, les produits GPU seront confrontés à des pénuries continues et à des augmentations de prix. Le cycle de livraison actuel de Nvidia s'allonge encore, d'un mois à aujourd'hui, il prend en gros trois mois ou plus, et même certaines commandes ne peuvent être livrées avant. la fin de l'année.
En outre, NVIDIA a également lancé la plate-forme informatique d'IA super puissante GH200, qui est non seulement plus rapide mais aussi plus économique pour la formation de grands modèles. Google Cloud, Meta, Microsoft et les logiciels ont tous annoncé qu'elle serait utilisée pour le travail d'IA générative ;
Pour la chaîne industrielle : il est devenu un consensus général sur le fait que l'utilisation de modules optiques a augmenté, et dans le même temps, la croissance de la demande de stockage et de PCB a commencé à se matérialiser lentement. Au cours des deux dernières années, les GPU avancés de Nvidia ont entraîné une forte augmentation de la demande de puces mémoire HBM, de sorte que les commandes HBM des deux principales sociétés de mémoire Samsung et Hynix ont également augmenté rapidement
À l'étranger
1. StyleDrop, le maître de la personnalisation de Google, revient dans le cercle du dessin de l'IA, qui est à la fois créatif et plus contrôlable.
StyleDrop peut capturer les nuances de texture, d'ombrage et de structure de différents styles. Il n'a besoin que d'une image comme référence, et il peut déconstruire et recréer quelle que soit la complexité du style artistique. Même les scientifiques de Nvidia ont qualifié ce résultat de « phénoménal ».
Des recherches éclairées estiment :
Par rapport à MidJourney, l'outil graphique précédemment populaire, StyleDrop peut mieux contrôler le style de génération d'images et le contenu généré sera plus proche des besoins du concepteur. La particularité de MidJourney est qu'il évite les simples effets de caméra quotidiens et augmente le réalisme global lors de la génération d'images ultra-claires. De plus, il préfère ces dernières en termes de contenu et de préférences esthétiques.
Mais la même chose entre les deux, c'est qu'ils peuvent s'inspirer d'autres médias artistiques et styles de peinture et créer des créations.
2. Apple lancera la stratégie AIGC+MR, et AI+XR deviendra le champ de bataille mobile de nouvelle génération
Le marché a des attentes très élevées envers MR. De plus, à en juger par le fait qu'Apple a toujours été une référence en matière d'électronique grand public, MR, qui attend depuis 7 ans, pourrait lancer un blockbuster dans l'industrie XR. à MR, à la fois en termes de technologie ou un tout nouveau changement d’expérience.
Des recherches éclairées estiment :
Le développement rapide de l'IA générative et la combinaison de la MR entraîneront une mise à niveau complète des produits mobiles, notamment en termes d'innovation de contenu d'application, qui brisera les méthodes de développement précédentes et améliorera considérablement le problème actuel de quelques catégories de jeux XR populaires. .
Cela deviendra également un facteur important dans le naufrage du marché MR. Auparavant, la difficulté de percer après que la pénétration des jeux XR ait atteint un goulot d'étranglement de croissance était la nature de niche de l'écosystème d'applications et le nombre de fans fidèles. l'écosystème Apple est extrêmement vaste, et grâce à l'intégration globale de haute qualité du contenu + du terminal + de l'écologie, il contribuera aux ventes rapides de MR et pilotera un nouveau cycle de développement de la chaîne industrielle XR. Nous avons déjà analysé dans AI Daily que le leader du marché de la réalité virtuelle, Meta, avait annoncé à l'avance l'impact de la sortie d'automne d'Oculus 3 sur le marché.
3. L'équipe NVIDIA lance un grand modèle d'IA vidéo 3D, la réalité virtuelle est plus réaliste
NVIDIA Research a développé un nouveau grand modèle d'IA Neuralangelo, qui est un modèle d'IA qui utilise des réseaux de neurones pour éditer des vidéos 3D en vue d'une reconstruction 2D. Le nouveau modèle peut transformer les vidéos de n'importe quel appareil en structures 3D détaillées.
Jianzhi Research estime :
Bien que la technologie de génération 3D existe depuis longtemps, ce qui mérite l'attention, c'est que Neuralangelo, un grand modèle d'IA, a largement surpassé toutes les méthodes précédentes en termes de capacité à convertir des vidéos 2D en objets 3D. Le modèle sélectionnera des images prises sous différents angles à partir de la vidéo 2D pour obtenir les détails de la représentation de l'objet 3D, et enfin les restituera pour améliorer la clarté des détails. La caractéristique de ce modèle est que la solution de NVIDIA peut mieux structurer les détails de la vidéo, rendant le contenu plus clair, et elle peut être bien appliquée que ce soit pour de petites statues ou de grandes constructions.
Concentrez-vous particulièrement sur les domaines qui pourront être largement utilisés à l'avenir : tels que la réalité virtuelle, les jumeaux numériques, le développement de robots, le numérique industriel et d'autres scènes à grande échelle construites à l'aide d'objets 3D.
4. Microsoft lancera Teams 2.0 à la fin de l'année, et le système d'exploitation lancera une attaque d'IA
Microsoft prévoit de commencer à utiliser Teams 2.0 par défaut sur les plateformes Win10 et Win11 avant la fin de 2023 ; de lancer la version préliminaire de Teams 2.0 auprès des utilisateurs Mac, VDI et Web, et de la promouvoir davantage auprès d'autres groupes de clients tels que l'éducation et gouvernement .
La nouvelle version de Teams promet une installation 3 fois plus rapide, un temps de démarrage 2 fois plus rapide et une commutation 1,7 fois plus rapide entre les chats et les canaux. Rejoindre des réunions devrait également être 2 fois plus rapide ; l'utilisation des ressources mémoire devrait être réduite de 50 % et l'espace disque de 70 %.
Jianzhi Research estime :
Teams 2.0 est intégré à Windows et son impact sur le système d'exploitation sera bouleversant. Cela accélérera considérablement le processus d'IA côté PC, y compris la commodité de la vidéoconférence, de l'assistant de chat IA, d'Office365 et bien d'autres. d’autres outils. La flexibilité et l’intelligence changeront complètement les habitudes d’utilisation des utilisateurs. Ce qui est particulièrement remarquable, c'est que la version mise à niveau de Teams 2.0 consomme moins de mémoire et est plus rapide, de sorte que l'utilisation multithread et haute fréquence ne sera pas particulièrement lente.
国AI
1. Les politiques sont favorables dans de nombreux endroits, et Pékin, Shanghai et Shenzhen ont successivement introduit des plans de développement de l'IA
Jianzhi Research estime :
Les gouvernements locaux publieront successivement des politiques visant à encourager le développement de l'industrie de l'IA, de la construction de la puissance de calcul du matériel sous-jacent à la recherche et au développement de robots intelligents incarnés côté application, tous entreront dans une période de dividendes politiques. afin de créer un monde meilleur et plus ouvert. L'environnement favorise le développement rapide de l'industrie de l'IA. Hier, Pékin et Shanghai ont également présenté de nouveaux plans politiques pour l'IA : ils comprennent la mise en œuvre d'un programme de partenariat en matière de puissance de calcul, le renforcement de la coopération avec les fournisseurs de cloud et la fourniture d'une puissance de calcul inclusive, diversifiée et de haute qualité ; puissance de calcul, etc. Construction d’infrastructures d’intelligence artificielle et autres contenus.
De manière générale, les progrès nationaux actuels dans la recherche et le développement de grands modèles sont également très rapides. Les grands modèles open source disposent également de bases de données sécurisées. Le développement d'applications d'IA telles que la propriété intellectuelle des médias, des jeux et d'autres contenus est mis en œuvre rapidement. . Concentrez-vous sur le développement de la filière intelligence incorporée. Le domaine en est encore à un stade relativement précoce et des opportunités de développement innovantes méritent d'être attendues.
2. Tencent investit pour la première fois dans les grands modèles ! Il a été révélé que Minimax avait réalisé un nouveau financement de 250 millions de dollars américains
Jianzhi Research estime :
En raison de la vague de développement de grands modèles et d'IA entraînée par ChatGPT, de nombreuses startups vedettes émergent les unes après les autres. MiniMax est devenue l'acteur vedette le plus rentable dans le domaine du capital-risque en un peu plus d'un an et demi après son lancement. établissement. Le logiciel de chat virtuel Glow a été lancé en novembre de l'année dernière ; l'assistant d'IA de dialogue génératif Inspo a été lancé en mars de cette année ; il a également lancé une plate-forme ouverte API pour les utilisateurs d'entreprise pour prendre en charge les appels de service de modèles de texte et de parole. Depuis sa création, MiniMax s'est développé rapidement et est désormais évalué à plus de 1,2 milliard de dollars. Alors que Tencent investit pour la première fois dans des start-ups à grande échelle, il est prévisible qu'avec la reconnaissance et la recherche de capitaux, l'atmosphère entrepreneuriale de l'IA deviendra plus active.
3. L'assistant Alibaba Cloud AI "Tongyi Listening" est en version bêta publique et la vitesse de lancement de l'application dépassera les attentes
Jianzhi Research estime :
La mise en œuvre de grands modèles nationaux dans le domaine des applications progresse très rapidement. Tongyi Listening est principalement utilisé dans les domaines audio et vidéo, offrant aux utilisateurs une nouvelle expérience d'enregistrement et de lecture de contenu audio et vidéo. La rigidité des utilisateurs des logiciels traditionnels sera bientôt brisée. Il convient de noter qu'en termes de résumé du contenu, Feishu Miaoji ne peut fournir que des mots-clés ; tandis que pour les discours des différents invités, Tingwu peut fournir des résumés de discours correspondants. Dans le même temps, il convient de prêter attention à l'utilisation de grands modèles de discours sur le site. terminal mobile. Les progrès des applications, tels que les haut-parleurs intelligents, sont un très bon port.
4. Torsi a publié une base de données purement auto-développée - Haibei Search Database V10
Des recherches éclairées estiment :
Haibei est une base de données de moteur de recherche purement nationale qui est entièrement auto-développée depuis l'algorithme de segmentation de mots sous-jacent jusqu'au moteur principal et au système de couche supérieure. Elle présente les caractéristiques d'un niveau de sécurité, d'une compatibilité et d'une récupération hautes performances. non seulement permet une indexation complète, il prend en charge les requêtes combinées dans toutes les dimensions, et l'efficacité de l'interrogation et de l'analyse des données est supérieure à celle des autres systèmes de gestion du Big Data ; il peut également réaliser un partitionnement automatique des données chaudes et froides et prendre en charge l'utilisation mixte ; de plusieurs stockages.
Du point de vue applicatif, notamment dans les domaines à forte spécificité et haute sécurité, tels que la banque, les affaires gouvernementales, l'industrie militaire, etc., il fait preuve d'une très forte compétitivité.
5. Le premier projet open source conflictuel anti-discrimination du grand modèle chinois d'IA : tout le monde pose 100 questions « venimeuses »
Des recherches éclairées estiment :
L'annotation des données est une étape cruciale dans le processus de grands modèles. Ce n'est qu'en utilisant « l'ensemble de données sécurisé » annoté pour la formation du modèle que nous pouvons obtenir des résultats de formation idéaux. Cependant, les normes de données ont toujours été accompagnées de caractéristiques subjectives, religieuses et personnelles. Par conséquent, si vous utilisez des ensembles de données étrangers pour la formation, vous serez « acclimaté » dans une certaine mesure et il est très important de construire une formation locale. ensemble de données. Le premier projet de confrontation anti-discrimination de l’IA chinoise a rassemblé de nombreux experts du secteur et deviendra l’un des ensembles de données de haut niveau pour la formation nationale de grands modèles open source.
Suivez la semaine prochaine
Conférence Apple WWDC, MR peut-il être à la hauteur des attentes et conduire l'industrie XR dans une nouvelle ère.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!