


La technologie de l'IA accélère les itérations : la stratégie des grands modèles du point de vue de Zhou Hongyi
Depuis cette année, Zhou Hongyi, fondateur du groupe 360, parle d'un sujet partout où il se trouve en public, à savoir les modèles d'intelligence artificielle à grande échelle. Il se qualifie de « prédicateur du GPT » et s'émerveille des progrès réalisés par ChatGPT, et croit fermement que ces progrès favoriseront l'itération de la technologie de l'IA.
En tant qu'entrepreneur célèbre qui sait bien s'exprimer, les discours de Zhou Hongyi sont souvent pleins de remarques pleines d'esprit, de sorte que ses « sermons » ont également créé de nombreux sujets d'actualité et ont même ajouté du feu aux grands modèles d'IA.
Bien que Zhou Hongyi soit devenu un leader d'opinion, les gens s'inquiètent davantage de la façon dont l'entreprise 360 qu'il dirige répond à cette vague de révolution de l'intelligence artificielle. En fait, au sein de 360, Zhou Hongyi a déjà initié un changement pour tous les employés. En avril, il a publié une lettre interne exigeant que chaque employé, produit et entreprise de 360 adopte pleinement l'intelligence artificielle, s'adapte à la collaboration homme-machine et lance un produit. développement.
Si le calendrier est avancé, en février, 360 a répondu pour la première fois à la configuration de la technologie de type GPT, affirmant que l'Institut de recherche sur l'intelligence artificielle de l'entreprise avait fait des progrès continus dans la technologie AIGC, y compris la technologie de type ChatGPT depuis 2020. Cependant, pour l’instant, il n’est utilisé que comme outil de productivité à usage interne au sein de l’entreprise. 360 lancera dès que possible une version de démonstration de la technologie de type ChatGPT.
À la fin du Forum sur le développement et le sommet de la sécurité numérique 2023, Zhou Hongyi a présenté la version 360 des produits ChatGPT aux participants. A cette époque, le nom du produit n'avait pas encore été déterminé. Zhou Hongyi a plaisanté : « Aujourd'hui, nous allons sortir le nouveau-né et rencontrer tout le monde.
Moins de trois mois plus tard, le 13 juin, 360 a officiellement lancé « 360 Intelligent Brain 4.0 » et a annoncé que 360 Intelligent Brain serait entièrement intégré au « 360 Family Bucket ».
Zhou Hongyi a déclaré que les trois derniers mois sont comme les trente dernières années de l'histoire de l'intelligence artificielle. Diverses innovations ont émergé les unes après les autres, et la version de 360 Intelligent Brain a également subi de nombreuses itérations. Il estime que le rythme actuel de développement des modèles à grande échelle en Chine est très rapide. Diverses entreprises se font concurrence et se promeuvent, de sorte que l'écart avec les principaux modèles à grande échelle du monde se réduit constamment.
"Au départ, j'avais dit qu'il y avait un écart d'un an et demi ou deux, mais je le reviens aujourd'hui. Je pense que la vitesse de développement et d'itération entre les pairs nationaux a fondamentalement rattrapé ou est proche du niveau avancé international, "Dit Zhou Hongyi.
Une stratégie de grand modèle émerge
En y regardant maintenant, le produit de type ChatGPT lancé par 360 fin mars était 360 Intelligent Brain 1.0, à cette époque, ses capacités n'étaient combinées qu'avec la recherche et ne prenaient pas en charge plusieurs cycles de conversations fin avril. , 360 Intelligent Brain itéré vers la version 2.0. Plusieurs séries de dialogues ont été lancées ; à la mi-mai, 360 a publié l'application graphique multimodale « 360 Hongtu », et 360 Intelligent Brain a également été itéré vers la version 2.5 ; , 360 a publié un grand modèle visuel et 360 Intelligent Brain a également été mis à jour vers la version 3.0 .
Le changement le plus important apporté au 360 Intelligence Brain 4.0 récemment lancé réside dans ses capacités multimodales, par rapport à la version précédente. À l'heure actuelle, 360 dispose de capacités de génération multimodale, notamment des capacités de traitement de texte, des capacités de traitement d'images, des capacités de traitement vocal et des capacités de traitement vidéo, qui peuvent réaliser du texte basé sur du texte, des images basées sur du texte, des tableaux basés sur du texte, des images basées sur des images. , texte basé sur une image, compréhension vidéo, etc. Fonction.
Lors de la conférence, la fonction multimodale « Wensheng Video » de 360 Intelligent Brain a été lancée pour la première fois en Chine. N'importe quel script texte peut générer une vidéo sans être limité par les compétences et les matériaux professionnels, démontrant la capacité de « faire quelque chose à partir de ». rien".
Zhou Hongyi a déclaré que les grands modèles développés par la Chine ont désormais rattrapé le GPT3.5 à bien des égards, et que la vitesse de rattrapage du GPT4.0 dépasse l'imagination. Par conséquent, la clé pour dépasser dans les virages est de développer le multi-. capacité de modalité.
« Un grand modèle d'IA complet doit avoir quatre capacités majeures, notamment le traitement de texte, le traitement d'images, le traitement de la parole et le traitement vidéo. » Zhou Hongyi a déclaré : « La concurrence des grands modèles à l'avenir sera celle des capacités multimodales. Ce n'est qu'avec plusieurs capacités modales que les grands modèles peuvent véritablement atteindre un nouveau niveau.
"La stratégie à grande échelle du Groupe 360 a officiellement émergé avec la sortie de 360 Brain 4.0, qui peut se résumer à "deux ailes volant ensemble et quatre chemins fonctionnant simultanément".". Parmi eux, « voler ensemble des deux côtés » fait référence à la technologie et aux scénarios, et « la concurrence à quatre voies » représente quatre directions d'application, à savoir les consommateurs, les petites et moyennes entreprises, le gouvernement et les grandes entreprises et industries.
Selon Zhou Hongyi, en termes de technologie, en raison des besoins du secteur de la recherche, 360 a créé un institut de recherche sur l'IA dès 2015 et a accumulé des technologies de base pour de grands modèles tels que la compréhension du langage naturel. En outre, grâce à l'Internet des objets, 360 a également commencé à explorer la multimodalité en 2018.
"En 2018, Google a publié l'algorithme Bert, et 360 l'a suivi et utilisé à cette époque, y compris plus tard T5 et GPT, et 360 a également mené des recherches", a déclaré Zhou Hongyi, "En tant que fabricant de moteurs de recherche, nous n'attendons pas cette fois pour développer de grands modèles. Nous n'avons suivi que lorsque GPT est devenu populaire. En fait, cela a commencé dès 2018, c'est pourquoi nous avons pu lancer des produits associés si rapidement.
Actuellement, 360 dispose de dix fonctionnalités principales dans la technologie des grands modèles : génération et création, dialogue multi-tours, capacités de codage, classification de texte, réécriture de texte, compréhension en lecture, logique et raisonnement, questions et réponses de connaissances, multimodalité et traduction. Dimensions Couvrant des centaines de fonctions subdivisées, il peut couvrir tous les scénarios d'application des grands modèles et se classe au premier rang des grands modèles nationaux dans plusieurs évaluations tierces.
En mai de cette année, dans un résultat d'évaluation du Chinese General Large Model Benchmark (SuperCLUE), 360 Intelligent Brain s'est classé premier parmi les grands modèles nationaux dans de multiples capacités ; le 12 juin, 360 Intelligent Brain est devenu le premier modèle domestique à passer le test ; SuperCLUE Un produit grand modèle évalué par les « Capacités de base du modèle de langage large AIGC de confiance » de l'Institut de technologie de Tongyuan.
Accélérer la mise en œuvre des applications
Concernant le développement futur des grands modèles, Zhou Hongyi a souligné que le simple fait de disposer de capacités de base ne pourrait pas entraîner une révolution dans l'industrie et les produits. La clé réside dans la manière de combiner les capacités générales d'IA des grands modèles avec davantage de scénarios. La valeur des grands modèles réside dans la généralisation, l’industrialisation et la verticalisation des capacités de l’IA, ainsi que dans leur profonde intégration avec les besoins métiers spécifiques de différentes industries et entreprises.
"Je pense que de telles opportunités industrielles ne font que commencer. Il y aura une période de dividende d'au moins 10 ans dans le futur, y compris toutes les applications, sites Web et même toutes les industries qui méritent d'être remodelées avec l'intelligence artificielle générale", Zhou Hongyi dit.
Il y a deux mois, Zhou Hongyi a déclaré sans ambages que « l'intégration en profondeur de GPT et de centaines d'industries changera directement le paysage concurrentiel de l'industrie, et les entreprises qui ne peuvent pas prendre ce train seront éliminées. Par conséquent, il exige également que tout le monde soit éliminé ». produits à l'intérieur de 360 Les managers et les ingénieurs doivent faire preuve d'imagination pour imaginer comment remodeler leurs produits à l'ère de l'intelligence artificielle.
Lors de la conférence de presse, Zhou Hongyi a également annoncé officiellement que « 360 Intelligent Brain 4.0 » sera connecté à 360 produits complets tels que les navigateurs, la recherche et les agents de sécurité pour réaliser une refonte intelligente complète. "Microsoft a récemment lancé un système d'exploitation appelé CoPilot, qui équivaut au copilote de Windows. Il intègre des capacités d'intelligence artificielle dans chaque ordinateur. En Chine, 360 est peut-être le fabricant le plus proche des capacités de Microsoft."
De plus, 360AI digital human a également été officiellement dévoilé lors de la conférence de presse. Selon Zhou Hongyi, la principale innovation de 360 dans les modèles d’IA à grande échelle concerne les humains numériques. Les humains numériques deviendront à l’avenir l’entrée d’application la plus importante pour les modèles d’intelligence artificielle à grande échelle. 360 s’appuiera sur les capacités du modèle cérébral intelligent de 360 pour redéfinir « l’humain numérique ». Différent des humains numériques traditionnels qui ne peuvent produire du contenu que selon des scripts établis, les humains numériques 360AI se caractérisent par des souvenirs, des personnalités et des personnalités, et par leur capacité à reproduire leur façon de penser et leurs expériences de vie.
Selon notre compréhension, les personnes du numérique 360AI sont actuellement divisées en deux types : les célébrités du numérique et les employés du numérique, avec un total de plus de 200 rôles disponibles. Les célébrités numériques incluent des personnages historiques, des stars idoles, des images littéraires, etc., permettant aux utilisateurs d'avoir un contact étroit avec des idoles dans des conversations ouvertes avec des personnes numériques ; les employés numériques peuvent devenir des assistants de connaissances et des assistants de bureau pour les employés de l'entreprise, améliorant ainsi l'efficacité des opérations de l'entreprise.
De plus, les personnes numériques 360AI prennent en charge la personnalisation. Chacun peut générer ses propres personnes numériques exclusives à faible coût en téléchargeant une base de connaissances privée, telle que des clones numériques, des assistants numériques, des idoles numériques, etc.
Zhou Hongyi a déclaré que l'orientation future du développement des humains numériques 360AI est de générer des sons, des vidéos et d'avoir une mémoire à long terme, et même d'avoir la capacité de décomposer et de planifier des objectifs, et d'avoir des « mains et des pieds » et la capacité d'exécuter pour mieux rendre des services aux humains. « L’évolution de l’IA doit être centrée sur l’humain, et les grands modèles doivent devenir les amis et les assistants des humains. »
Au cours des six derniers mois, de nombreux entrepreneurs ont été enthousiasmés par le développement de grands modèles d'IA et ont investi leurs efforts dans de nouveaux domaines entrepreneuriaux. Zhou Hongyi, qui a dépassé son destin, en fait également partie. Il a souligné à plusieurs reprises que « nous vivons un moment révolutionnaire dans l'histoire de la technologie et des affaires » et est heureux d'étudier les grands modèles.
À la mi-mai, après une itération de 360 Intelligent Brain, Zhou Hongyi a distribué des centaines de codes de test en ligne dans un groupe WeChat vers 23 heures tard dans la nuit, et a discuté avec les gens de la manière de poser des questions avec un grand intérêt. Ce n’était pas courant dans le passé. Mais à l’ère de la super intelligence artificielle, tout devient possible.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le 30 mai, Tencent a annoncé une mise à niveau complète de son modèle Hunyuan. L'application « Tencent Yuanbao » basée sur le modèle Hunyuan a été officiellement lancée et peut être téléchargée sur les magasins d'applications Apple et Android. Par rapport à la version de l'applet Hunyuan lors de la phase de test précédente, Tencent Yuanbao fournit des fonctionnalités de base telles que la recherche IA, le résumé IA et l'écriture IA pour les scénarios d'efficacité du travail ; pour les scénarios de la vie quotidienne, le gameplay de Yuanbao est également plus riche et fournit de multiples fonctionnalités d'application IA. , et de nouvelles méthodes de jeu telles que la création d'agents personnels sont ajoutées. « Tencent ne s'efforcera pas d'être le premier à créer un grand modèle. » Liu Yuhong, vice-président de Tencent Cloud et responsable du grand modèle Tencent Hunyuan, a déclaré : « Au cours de l'année écoulée, nous avons continué à promouvoir les capacités de Tencent. Grand modèle Tencent Hunyuan. Dans la technologie polonaise riche et massive dans des scénarios commerciaux tout en obtenant un aperçu des besoins réels des utilisateurs.

Tan Dai, président de Volcano Engine, a déclaré que les entreprises qui souhaitent bien mettre en œuvre de grands modèles sont confrontées à trois défis clés : l'effet de modèle, le coût d'inférence et la difficulté de mise en œuvre : elles doivent disposer d'un bon support de base de grands modèles pour résoudre des problèmes complexes, et elles doivent également avoir une inférence à faible coût. Les services permettent d'utiliser largement de grands modèles, et davantage d'outils, de plates-formes et d'applications sont nécessaires pour aider les entreprises à mettre en œuvre des scénarios. ——Tan Dai, président de Huoshan Engine 01. Le grand modèle de pouf fait ses débuts et est largement utilisé. Le polissage de l'effet de modèle est le défi le plus critique pour la mise en œuvre de l'IA. Tan Dai a souligné que ce n'est que grâce à une utilisation intensive qu'un bon modèle peut être poli. Actuellement, le modèle Doubao traite 120 milliards de jetons de texte et génère 30 millions d'images chaque jour. Afin d'aider les entreprises à mettre en œuvre des scénarios de modèles à grande échelle, le modèle à grande échelle beanbao développé indépendamment par ByteDance sera lancé à travers le volcan.

1. Positionnement du produit TensorRT-LLM TensorRT-LLM est une solution d'inférence évolutive développée par NVIDIA pour les grands modèles de langage (LLM). Il crée, compile et exécute des graphiques de calcul basés sur le cadre de compilation d'apprentissage en profondeur TensorRT et s'appuie sur l'implémentation efficace des noyaux dans FastTransformer. De plus, il utilise NCCL pour la communication entre les appareils. Les développeurs peuvent personnaliser les opérateurs pour répondre à des besoins spécifiques en fonction du développement technologique et des différences de demande, comme le développement de GEMM personnalisés basés sur le coutelas. TensorRT-LLM est la solution d'inférence officielle de NVIDIA, engagée à fournir des performances élevées et à améliorer continuellement sa praticité. TensorRT-LL

Selon des informations du 4 avril, l'Administration du cyberespace de Chine a récemment publié une liste de grands modèles enregistrés, et le « Grand modèle d'interaction du langage naturel Jiutian » de China Mobile y a été inclus, indiquant que le grand modèle Jiutian AI de China Mobile peut officiellement fournir des informations artificielles génératives. services de renseignement vers le monde extérieur. China Mobile a déclaré qu'il s'agit du premier modèle à grande échelle développé par une entreprise centrale à avoir réussi à la fois le double enregistrement national « Enregistrement du service d'intelligence artificielle générative » et le double enregistrement « Enregistrement de l'algorithme de service de synthèse profonde domestique ». Selon les rapports, le grand modèle d'interaction en langage naturel de Jiutian présente les caractéristiques de capacités, de sécurité et de crédibilité améliorées de l'industrie, et prend en charge la localisation complète. Il a formé plusieurs versions de paramètres telles que 9 milliards, 13,9 milliards, 57 milliards et 100 milliards. et peut être déployé de manière flexible dans le Cloud, la périphérie et la fin sont des situations différentes

Si les questions du test sont trop simples, les meilleurs étudiants et les mauvais étudiants peuvent obtenir 90 points, et l'écart ne peut pas être creusé... Avec la sortie plus tard de modèles plus puissants tels que Claude3, Llama3 et même GPT-5, l'industrie est en besoin urgent d'un modèle de référence plus difficile et différencié. LMSYS, l'organisation à l'origine du grand modèle Arena, a lancé la référence de nouvelle génération, Arena-Hard, qui a attiré une large attention. Il existe également la dernière référence pour la force des deux versions affinées des instructions Llama3. Par rapport à MTBench, qui avait des scores similaires auparavant, la discrimination Arena-Hard est passée de 22,6 % à 87,4 %, ce qui est plus fort et plus faible en un coup d'œil. Arena-Hard est construit à partir de données humaines en temps réel provenant de l'arène et a un taux de cohérence de 89,1 % avec les préférences humaines.

1. Introduction au contexte Tout d’abord, présentons l’historique du développement de la technologie Yunwen. Yunwen Technology Company... 2023 est la période où les grands modèles prédominent. De nombreuses entreprises pensent que l'importance des graphiques a été considérablement réduite après les grands modèles et que les systèmes d'information prédéfinis étudiés précédemment ne sont plus importants. Cependant, avec la promotion du RAG et la prévalence de la gouvernance des données, nous avons constaté qu'une gouvernance des données plus efficace et des données de haute qualité sont des conditions préalables importantes pour améliorer l'efficacité des grands modèles privatisés. Par conséquent, de plus en plus d'entreprises commencent à y prêter attention. au contenu lié à la construction des connaissances. Cela favorise également la construction et le traitement des connaissances à un niveau supérieur, où de nombreuses techniques et méthodes peuvent être explorées. On voit que l'émergence d'une nouvelle technologie ne détruit pas toutes les anciennes technologies, mais peut également intégrer des technologies nouvelles et anciennes.

Selon les informations du 13 juin, selon le compte public « Volcano Engine » de Byte, l'assistant d'intelligence artificielle de Xiaomi « Xiao Ai » a conclu une coopération avec Volcano Engine. Les deux parties réaliseront une expérience interactive d'IA plus intelligente basée sur le grand modèle beanbao. . Il est rapporté que le modèle beanbao à grande échelle créé par ByteDance peut traiter efficacement jusqu'à 120 milliards de jetons de texte et générer 30 millions de contenus chaque jour. Xiaomi a utilisé le grand modèle Doubao pour améliorer les capacités d'apprentissage et de raisonnement de son propre modèle et créer un nouveau « Xiao Ai Classmate », qui non seulement saisit plus précisément les besoins des utilisateurs, mais offre également une vitesse de réponse plus rapide et des services de contenu plus complets. Par exemple, lorsqu'un utilisateur pose une question sur un concept scientifique complexe, &ldq

Bonjour à tous, je m'appelle Casson. De nombreux amis programmeurs souhaitent participer au développement de leurs propres produits d’IA. Nous pouvons diviser la forme du produit en quatre quadrants en fonction du « degré d'automatisation des processus » et du « degré d'application de l'IA ». Parmi eux : le degré d'automatisation des processus mesure "la part du processus de service du produit qui nécessite une intervention manuelle" et le degré d'application de l'IA mesure "la proportion d'application de l'IA dans le produit". Premièrement, limiter la capacité de l'IA à traiter un Application d'image AI, et l'utilisateur la transmet via l'application. Le processus de service complet peut être complété en interagissant avec l'interface utilisateur, ce qui entraîne un degré élevé d'automatisation. Dans le même temps, le « traitement d'images IA » s'appuie fortement sur les capacités de l'IA, de sorte que son application est élevée. Le deuxième quadrant est le domaine conventionnel du développement d'applications, tel que le développement d'applications de gestion des connaissances, d'applications de gestion du temps et d'automatisation élevée des processus.
