


360 Zhou Hongyi : Le développement de l'IA est une tendance inévitable, et nous devons maîtriser pleinement la technologie de base des grands modèles
Le 31 mai, 360 Smart Life a officiellement lancé le grand modèle 360 Intelligent Brain Vision et une variété de nouveaux produits matériels d'IA, et a annoncé que 360 Smart Life était officiellement entré sur le marché des PME. Après la réunion, Zhou Hongyi, fondateur du groupe 360, a accepté des interviews des médias sur certains sujets d'actualité liés aux grands mannequins ces derniers jours.
Zhou Hongyi estime que pour les goulots d'étranglement des modèles à grande échelle, le problème des hallucinations est actuellement le plus gros goulot d'étranglement, mais ce problème est à la fois son défaut et sa caractéristique. "Il existe une différence essentielle entre les grands modèles et la recherche. La recherche consiste simplement à copier des connaissances. Les grands modèles tentent de comprendre toutes les connaissances et de les "avaler", mais cela peut entraîner l'ignorance des détails
."Il a expliqué qu'actuellement, les grands modèles peuvent être utilisés pour certaines applications de divertissement. Par exemple, ils peuvent être utilisés pour écrire des histoires similaires à "Monkey King vs. Ultraman". À ce stade, il n’est pas possible d’adapter des modèles à grande échelle à des domaines professionnels tels que le droit, l’éducation et la santé. Notre objectif est de transformer le moteur de recherche en base de connaissances pour résoudre le problème de l'ambiguïté des connaissances. Lorsqu'il s'agit de questions sur l'exactitude des connaissances, nous pouvons vérifier et réviser les réponses grâce à des recherches. »
Zhou Hongyi estime que le grand modèle visuel publié hier soir peut être considéré comme un grand modèle vertical par rapport à la catégorie. "Pour faire simple, le grand modèle visuel actuel est basé sur le grand modèle de langage, de la compréhension initiale du langage à l'interprétation plus profonde du 'langage + image'
."Dans le même temps, il a également admis que par rapport à d'autres grands modèles, il n'y a en fait pas beaucoup de différence entre 360 Intelligent Brain. "360 Intelligent Brain a deux caractéristiques. La première concerne les données d'entraînement. 360 a éliminé de nombreuses données de haute qualité pour prendre en charge le grand modèle ; la seconde est qu'après avoir modifié l'interface de recherche, nous pouvons acquérir des connaissances et de l'actualité grâce recherche. Amélioration, afin que le problème d'hallucination le plus courant des grands modèles puisse être évité.
Concernant les scénarios d'utilisation réels du grand modèle visuel, Zhou Hongyi a déclaré qu'à l'avenir, le grand modèle visuel pourra être combiné avec des caméras pour être appliqué aux domaines de la navigation et de la sécurité automobile. Dans le domaine de la sécurité, il a donné un exemple : par exemple, si un enfant se tient debout sur une armoire haute, le danger potentiel peut être lu grâce à un grand modèle visuel et une alarme peut être émise.Dans le domaine de la navigation automobile, grâce à de grands modèles visuels, des dangers potentiels peuvent être découverts pendant le processus de navigation automobile, et le traitement des alarmes peut être effectué tout en conservant la vidéo, réduisant ainsi la probabilité de danger pour le conducteur. « Par exemple, lors d'un incident de sécurité survenu dans les rues de Shanghai il y a deux jours, si la voiture derrière a le support d'un grand modèle visuel, elle peut identifier l'anomalie de la voiture qui précède. Ensuite, elle peut automatiquement enregistrer le vidéo et téléchargez l'alarme en même temps. Processus. "
À la fin de l'interview, Zhou Hongyi a exprimé certaines de ses propres opinions sur certains des problèmes de sécurité à l'ère de l'IA qui ont été soulevés par le « changement de visage de l'IA » il y a quelque temps. Il a souligné que les problèmes de sécurité de l'IA doivent être pris au sérieux et 360 a créé une équipe interne de sécurité de l'IA pour se concentrer sur la résolution des problèmes de sécurité dans ce domaine. Il a ajouté : "Les professionnels de l'IA devront à l'avenir effectuer une vérification secondaire dans les travaux générés par l'IA, comme l'ajout d'une reconnaissance d'empreintes digitales ou vocales et d'autres mesures." »
"L'IA est une révolution industrielle et son développement est une tendance inévitable. Nous ne pouvons pas arrêter d'en manger simplement parce qu'elle présente des problèmes de sécurité. Ce que 360 doit faire maintenant, c'est minimiser ce problème de sécurité. Elle ne doit pas seulement résoudre la sécurité des réseaux, mais aussi Pour résoudre le problème de la sécurité des données et de la sécurité de l'intelligence artificielle, 360 doit également s'efforcer d'atteindre le summum en matière de recherche et de développement de grands modèles, car les grands modèles sont le summum de la numérisation et d'un changement au niveau de la révolution industrielle. maîtriser la technologie de base des grands modèles ? Il n'existe pas de scénarios d'application pratiques pour les grands modèles, ils sont donc éliminés par l'industrie. Par conséquent, 360 doit non seulement mettre en place une équipe de recherche dédiée pour étudier, mais doit également trouver une meilleure solution. une solution plus sûre grâce à des tentatives continues", a déclaré Zhou Hongyi.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Le 30 mai, Tencent a annoncé une mise à niveau complète de son modèle Hunyuan. L'application « Tencent Yuanbao » basée sur le modèle Hunyuan a été officiellement lancée et peut être téléchargée sur les magasins d'applications Apple et Android. Par rapport à la version de l'applet Hunyuan lors de la phase de test précédente, Tencent Yuanbao fournit des fonctionnalités de base telles que la recherche IA, le résumé IA et l'écriture IA pour les scénarios d'efficacité du travail ; pour les scénarios de la vie quotidienne, le gameplay de Yuanbao est également plus riche et fournit de multiples fonctionnalités d'application IA. , et de nouvelles méthodes de jeu telles que la création d'agents personnels sont ajoutées. « Tencent ne s'efforcera pas d'être le premier à créer un grand modèle. » Liu Yuhong, vice-président de Tencent Cloud et responsable du grand modèle Tencent Hunyuan, a déclaré : « Au cours de l'année écoulée, nous avons continué à promouvoir les capacités de Tencent. Grand modèle Tencent Hunyuan. Dans la technologie polonaise riche et massive dans des scénarios commerciaux tout en obtenant un aperçu des besoins réels des utilisateurs.

Tan Dai, président de Volcano Engine, a déclaré que les entreprises qui souhaitent bien mettre en œuvre de grands modèles sont confrontées à trois défis clés : l'effet de modèle, le coût d'inférence et la difficulté de mise en œuvre : elles doivent disposer d'un bon support de base de grands modèles pour résoudre des problèmes complexes, et elles doivent également avoir une inférence à faible coût. Les services permettent d'utiliser largement de grands modèles, et davantage d'outils, de plates-formes et d'applications sont nécessaires pour aider les entreprises à mettre en œuvre des scénarios. ——Tan Dai, président de Huoshan Engine 01. Le grand modèle de pouf fait ses débuts et est largement utilisé. Le polissage de l'effet de modèle est le défi le plus critique pour la mise en œuvre de l'IA. Tan Dai a souligné que ce n'est que grâce à une utilisation intensive qu'un bon modèle peut être poli. Actuellement, le modèle Doubao traite 120 milliards de jetons de texte et génère 30 millions d'images chaque jour. Afin d'aider les entreprises à mettre en œuvre des scénarios de modèles à grande échelle, le modèle à grande échelle beanbao développé indépendamment par ByteDance sera lancé à travers le volcan.

« Une complexité élevée, une fragmentation élevée et des domaines interdomaines » ont toujours été les principaux problèmes sur la voie de la mise à niveau numérique et intelligente du secteur des transports. Récemment, le « modèle de trafic Qinling·Qinchuan » avec une échelle de paramètres de 100 milliards, construit conjointement par China Science Vision, le gouvernement du district de Xi'an Yanta et le centre informatique d'intelligence artificielle du futur de Xi'an, est orienté vers le domaine des transports intelligents. et fournit des services à Xi'an et ses environs. La région créera un pivot pour l'innovation en matière de transport intelligent. Le « modèle de trafic Qinling·Qinchuan » combine les données écologiques massives du trafic local de Xi'an dans des scénarios ouverts, l'algorithme avancé original développé indépendamment par China Science Vision et la puissante puissance de calcul de l'IA Shengteng du futur centre informatique d'intelligence artificielle de Xi'an pour fournir la surveillance du réseau routier, les scénarios de transport intelligents tels que la commande d'urgence, la gestion de la maintenance et les déplacements publics entraînent des changements numériques et intelligents. La gestion du trafic présente des caractéristiques différentes selon les villes, et le trafic sur différentes routes

1. Positionnement du produit TensorRT-LLM TensorRT-LLM est une solution d'inférence évolutive développée par NVIDIA pour les grands modèles de langage (LLM). Il crée, compile et exécute des graphiques de calcul basés sur le cadre de compilation d'apprentissage en profondeur TensorRT et s'appuie sur l'implémentation efficace des noyaux dans FastTransformer. De plus, il utilise NCCL pour la communication entre les appareils. Les développeurs peuvent personnaliser les opérateurs pour répondre à des besoins spécifiques en fonction du développement technologique et des différences de demande, comme le développement de GEMM personnalisés basés sur le coutelas. TensorRT-LLM est la solution d'inférence officielle de NVIDIA, engagée à fournir des performances élevées et à améliorer continuellement sa praticité. TensorRT-LL

Selon des informations du 4 avril, l'Administration du cyberespace de Chine a récemment publié une liste de grands modèles enregistrés, et le « Grand modèle d'interaction du langage naturel Jiutian » de China Mobile y a été inclus, indiquant que le grand modèle Jiutian AI de China Mobile peut officiellement fournir des informations artificielles génératives. services de renseignement vers le monde extérieur. China Mobile a déclaré qu'il s'agit du premier modèle à grande échelle développé par une entreprise centrale à avoir réussi à la fois le double enregistrement national « Enregistrement du service d'intelligence artificielle générative » et le double enregistrement « Enregistrement de l'algorithme de service de synthèse profonde domestique ». Selon les rapports, le grand modèle d'interaction en langage naturel de Jiutian présente les caractéristiques de capacités, de sécurité et de crédibilité améliorées de l'industrie, et prend en charge la localisation complète. Il a formé plusieurs versions de paramètres telles que 9 milliards, 13,9 milliards, 57 milliards et 100 milliards. et peut être déployé de manière flexible dans le Cloud, la périphérie et la fin sont des situations différentes

1. Introduction au contexte Tout d’abord, présentons l’historique du développement de la technologie Yunwen. Yunwen Technology Company... 2023 est la période où les grands modèles prédominent. De nombreuses entreprises pensent que l'importance des graphiques a été considérablement réduite après les grands modèles et que les systèmes d'information prédéfinis étudiés précédemment ne sont plus importants. Cependant, avec la promotion du RAG et la prévalence de la gouvernance des données, nous avons constaté qu'une gouvernance des données plus efficace et des données de haute qualité sont des conditions préalables importantes pour améliorer l'efficacité des grands modèles privatisés. Par conséquent, de plus en plus d'entreprises commencent à y prêter attention. au contenu lié à la construction des connaissances. Cela favorise également la construction et le traitement des connaissances à un niveau supérieur, où de nombreuses techniques et méthodes peuvent être explorées. On voit que l'émergence d'une nouvelle technologie ne détruit pas toutes les anciennes technologies, mais peut également intégrer des technologies nouvelles et anciennes.

Si les questions du test sont trop simples, les meilleurs étudiants et les mauvais étudiants peuvent obtenir 90 points, et l'écart ne peut pas être creusé... Avec la sortie plus tard de modèles plus puissants tels que Claude3, Llama3 et même GPT-5, l'industrie est en besoin urgent d'un modèle de référence plus difficile et différencié. LMSYS, l'organisation à l'origine du grand modèle Arena, a lancé la référence de nouvelle génération, Arena-Hard, qui a attiré une large attention. Il existe également la dernière référence pour la force des deux versions affinées des instructions Llama3. Par rapport à MTBench, qui avait des scores similaires auparavant, la discrimination Arena-Hard est passée de 22,6 % à 87,4 %, ce qui est plus fort et plus faible en un coup d'œil. Arena-Hard est construit à partir de données humaines en temps réel provenant de l'arène et a un taux de cohérence de 89,1 % avec les préférences humaines.

Attention, cet homme a connecté plus de 1 000 grands modèles, vous permettant de vous brancher et de switcher en toute transparence. Récemment, un flux de travail d'IA visuelle a été lancé : vous offrant une interface intuitive de type glisser-déposer, vous pouvez glisser, tirer et faire glisser pour organiser votre propre flux de travail sur un canevas infini. Comme le dit le proverbe, la guerre coûte cher, et Qubit a appris que dans les 48 heures suivant la mise en ligne de cet AIWorkflow, les utilisateurs avaient déjà configuré des flux de travail personnels avec plus de 100 nœuds. Sans plus tarder, je veux parler aujourd'hui de Dify, une société LLMOps, et de son PDG Zhang Luyu. Zhang Luyu est également le fondateur de Dify. Avant de rejoindre l'entreprise, il avait 11 ans d'expérience dans l'industrie Internet. Je suis engagé dans la conception de produits, je comprends la gestion de projet et j'ai des connaissances uniques sur le SaaS. Plus tard, il
