localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- L'Université Tsinghua a pris le relais et YOLOv10 est sorti : les performances ont été grandement améliorées et il figurait sur la hot list de GitHub
- La série de référence YOLO de systèmes de détection de cibles a une fois de plus reçu une mise à niveau majeure. Depuis la sortie de YOLOv9 en février de cette année, le relais de la série YOLO (YouOnlyLookOnce) a été passé entre les mains de chercheurs de l'Université Tsinghua. Le week-end dernier, la nouvelle du lancement de YOLOv10 a attiré l'attention de la communauté IA. Il est considéré comme un cadre révolutionnaire dans le domaine de la vision par ordinateur et est connu pour ses capacités de détection d'objets de bout en bout en temps réel, poursuivant l'héritage de la série YOLO en fournissant une solution puissante alliant efficacité et précision. Adresse de l'article : https://arxiv.org/pdf/2405.14458 Adresse du projet : https://github.com/THU-MIG/yo
- IA 1587 2024-06-06 12:20:45
-
- Pour améliorer l'utilisation des ensembles de données optiques, l'équipe Tianda a proposé un modèle d'IA pour améliorer l'effet de prédiction spectrale
- Editeur | Dead Leaf Butterfly Récemment, l'équipe du professeur agrégé Wu Liang et de l'académicien Yao Jianquan de l'Institut de laser et d'optoélectronique de l'Université de Tianjin et l'équipe du professeur Xiong Deyi du Laboratoire de traitement du langage naturel ont signalé une solution qui utilise un modèle d'apprentissage profond. avec entrée supplémentaire multifréquence pour améliorer l'effet de prédiction spectrale. Ce schéma peut améliorer la précision de la prédiction spectrale en utilisant des données d'entrée multifréquences. De plus, cette solution peut également réduire les interférences sonores dans le processus de prédiction spectrale, améliorant ainsi l'effet de prédiction. Cette solution peut améliorer l'utilisation des ensembles de données optiques existants et améliorer l'effet de prédiction des réponses spectrales correspondant aux structures de métasurface sans augmenter les coûts de formation. Les résultats de recherche pertinents sont intitulés « Enhancedspectrumpredictionusingdeep
- IA 726 2024-06-06 12:09:28
-
- Un seul grand modèle clairsemé de 4 090 inférables, 200 milliards, « Tiangong MoE » est open source
- Dans la vague des grands modèles, la formation et le déploiement de LLM à ensembles denses de pointe posent d'énormes défis en termes d'exigences informatiques et de coûts associés, en particulier à des échelles de dizaines ou de centaines de milliards de paramètres. Pour relever ces défis, les modèles clairsemés, tels que les modèles Mixture of Experts (MoE), sont devenus de plus en plus importants. Ces modèles offrent une alternative économiquement viable en distribuant le calcul à divers sous-modèles spécialisés, ou « experts », avec le potentiel d'égaler, voire de dépasser, les performances de modèles à ensemble dense avec de très faibles besoins en ressources. Le 3 juin, une autre nouvelle importante est venue du domaine des grands modèles open source : Kunlun Wanwei a annoncé le grand modèle open source Skywork-MoE de 200 milliards de dollars, qui réduit considérablement le coût d'inférence tout en maintenant de solides performances. Basé sur le précédent open source Skywo de Kunlun Wanwei
- IA 1005 2024-06-05 22:14:46
-
- HuggingFace vous apprend à créer un modèle visuel SOTA
- Il y a eu le GPT-4o d'OpenAI auparavant, et la série des rois de Google a suivi. Les grands modèles multimodaux avancés sont arrivés sur le marché les uns après les autres. D'autres pratiquants ont été choqués et ont commencé à réfléchir à la manière de rattraper à nouveau ces super modèles. Dans cet article de HuggingFace et de l'Université de la Sorbonne en France, ils ont résumé les expériences clés en matière de création de grands modèles visuels et ont indiqué une voie à suivre pour les développeurs. Ces expériences illustrées couvrent de nombreux aspects tels que la sélection de l'architecture du modèle, les méthodes de formation et les données de formation. L'auteur donne un résumé détaillé après plusieurs comparaisons. Les points essentiels sont les suivants : Si vous souhaitez faire du bon travail dans de grands modèles visuels, le choix de l'architecture est très important. Le modèle de langage a un impact plus important sur les performances globales que le module visuel. L'adoption d'une stratégie de pré-formation par étapes est plus propice au renforcement des capacités du modèle. Les données de formation doivent inclure
- IA 1002 2024-06-05 21:39:58
-
- Cinq écoles d'apprentissage automatique que vous ne connaissez pas
- L'apprentissage automatique est une branche importante de l'intelligence artificielle qui donne aux ordinateurs la possibilité d'apprendre à partir de données et d'améliorer leurs capacités sans être explicitement programmés. L'apprentissage automatique a un large éventail d'applications dans divers domaines, de la reconnaissance d'images et du traitement du langage naturel aux systèmes de recommandation et à la détection des fraudes, et il change notre façon de vivre. Il existe de nombreuses méthodes et théories différentes dans le domaine de l'apprentissage automatique, parmi lesquelles les cinq méthodes les plus influentes sont appelées les « Cinq écoles d'apprentissage automatique ». Les cinq grandes écoles sont l’école symbolique, l’école connexionniste, l’école évolutionniste, l’école bayésienne et l’école analogique. 1. Le symbolisme, également connu sous le nom de symbolisme, met l'accent sur l'utilisation de symboles pour le raisonnement logique et l'expression des connaissances. Cette école de pensée estime que l'apprentissage est un processus de déduction inversée, à travers les connaissances existantes.
- IA 969 2024-06-05 20:51:22
-
- Lancement du grand modèle Bytedance Beanbao, le service d'IA complet Volcano Engine aide les entreprises à se transformer intelligemment
- Tan Dai, président de Volcano Engine, a déclaré que les entreprises qui souhaitent bien mettre en œuvre de grands modèles sont confrontées à trois défis clés : l'effet de modèle, le coût d'inférence et la difficulté de mise en œuvre : elles doivent disposer d'un bon support de base de grands modèles pour résoudre des problèmes complexes, et elles doivent également avoir une inférence à faible coût. Les services permettent d'utiliser largement de grands modèles, et davantage d'outils, de plates-formes et d'applications sont nécessaires pour aider les entreprises à mettre en œuvre des scénarios. ——Tan Dai, président de Huoshan Engine 01. Le grand modèle de pouf fait ses débuts et est largement utilisé. Le polissage de l'effet de modèle est le défi le plus critique pour la mise en œuvre de l'IA. Tan Dai a souligné que ce n'est que grâce à une utilisation intensive qu'un bon modèle peut être poli. Actuellement, le modèle Doubao traite 120 milliards de jetons de texte et génère 30 millions d'images chaque jour. Afin d'aider les entreprises à mettre en œuvre des scénarios de modèles à grande échelle, le modèle à grande échelle beanbao développé indépendamment par ByteDance sera lancé à travers le volcan.
- IA 1193 2024-06-05 19:59:21
-
- Nouvelle recherche de NVIDIA : la longueur du contexte est sérieusement fausse et peu de performances 32K sont qualifiées
- Exposant impitoyablement le faux phénomène standard des grands modèles à « contexte long », la nouvelle recherche de NVIDIA a révélé que 10 grands modèles, dont GPT-4, génèrent des longueurs de contexte de 128 Ko, voire 1 Mo. Mais après quelques tests, le nouvel indicateur « contexte effectif » a considérablement diminué, et peu peuvent atteindre 32K. Le nouveau benchmark s'appelle RULER et comprend un total de 13 tâches réparties en quatre catégories : récupération, suivi multi-sauts, agrégation et questions et réponses. RULER définit la « longueur de contexte effective », qui est la longueur maximale à laquelle le modèle peut maintenir les mêmes performances que la ligne de base du Llama-7B à une longueur de 4K. La recherche a été jugée « très perspicace » par les universitaires. Après avoir vu cette nouvelle recherche, de nombreux internautes ont également voulu voir le contexte des joueurs royaux Claude et Gémeaux.
- IA 1182 2024-06-05 16:22:47
-
- L'ensemble du processus de déploiement de Yolov sur iPhone ou terminal pratique
- Le classique de la détection tant attendu connaît une autre vague d'attaques : YOLOv5. Parmi eux, YOLOv5 ne dispose pas de fichiers complets. Le plus important maintenant est de comprendre YOLOv4, qui bénéficiera beaucoup dans le domaine de la détection de cibles et peut être fortement amélioré dans certains scénarios. Aujourd'hui, nous analyserons YOLOv4 pour vous. Dans le prochain numéro, nous nous entraînerons à déployer YOLOv5 sur les téléphones Apple ou à le détecter en temps réel via la caméra du terminal ! 1. Examen technologique Il existe un grand nombre de fonctionnalités considérées pour améliorer la précision des réseaux de neurones convolutifs (CNN). Les combinaisons de ces caractéristiques doivent être testées pratiquement sur de grands ensembles de données et les résultats théoriquement validés. Certaines fonctions ne fonctionnent que sur certains modèles, certaines questions ne fonctionnent que sur certains modèles ou uniquement des problèmes à petite échelle.
- IA 595 2024-06-05 16:17:14
-
- Une nouvelle chaîne de perception tridimensionnelle de l'intelligence incarnée, TeleAI et Shanghai AI Lab ont proposé un modèle incarné de fusion multiperspective 'SAM-E'
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Lorsque nous récupérons une montre mécanique, nous voyons le cadran et les aiguilles de face, la couronne et le bracelet de côté, et lorsque nous ouvrons le dos de la montre. , nous verrons les engrenages et les mouvements complexes. Chaque perspective fournit des informations différentes, qui peuvent être combinées pour comprendre l’ensemble de l’objet opération.
- IA 603 2024-06-05 16:09:27
-
- Le Comité technique national de normalisation des données a officiellement approuvé la création
- Dans l'après-midi du 24 mai 2024, le forum principal du 7e Sommet de la construction en Chine numérique s'est tenu à Fuzhou. Liu Liehong, secrétaire du Groupe de direction du Parti et directeur de l'Administration nationale des données, Tian Shihong, membre du Groupe de direction du Parti et directeur adjoint de l'Administration d'État pour la régulation du marché, directeur de l'Administration nationale des normes, et d'autres ont assisté à la réunion. La réunion a eu des discussions approfondies sur l'importance et la planification stratégique de la construction numérique de la Chine. Les participants ont reconnu que la transformation numérique est devenue un moteur clé du développement national. Dans le même temps, ils ont souligné la large application de la technologie numérique dans l'économie, la société et la gouvernance. Lors de la réunion, Tian Shihong a lu l'« Avis sur la préparation de la création du Comité technique national de normalisation des données ». Le Comité technique national de normalisation des données sera responsable des ressources de données, de la technologie des données, de la circulation des données, des villes intelligentes, de la transformation numérique, etc.
- IA 615 2024-06-05 13:51:45
-
- Sélection de fonctionnalités via des stratégies d'apprentissage par renforcement
- La sélection des fonctionnalités est une étape critique dans le processus de création de modèles d’apprentissage automatique. Choisir de bonnes fonctionnalités pour le modèle et la tâche que nous voulons accomplir peut améliorer les performances. Si nous traitons d’ensembles de données de grande dimension, la sélection des caractéristiques est particulièrement importante. Cela permet au modèle d’apprendre plus rapidement et mieux. L’idée est de trouver le nombre optimal de fonctionnalités et les fonctionnalités les plus significatives. Dans cet article, nous présenterons et mettrons en œuvre une nouvelle sélection de fonctionnalités via une stratégie d'apprentissage par renforcement. Nous commençons par discuter de l’apprentissage par renforcement, en particulier des processus de décision markoviens. Il s'agit d'une méthode très nouvelle dans le domaine de la science des données, particulièrement adaptée à la sélection de fonctionnalités. Ensuite, il présente son implémentation et comment installer et utiliser la bibliothèque python (FSRLearning). Enfin, un exemple simple est utilisé pour démontrer cela
- IA 587 2024-06-05 13:00:43
-
- Une perspective prospective de HPE Aruba Networking : créer un réseau convergé sécurisé basé sur l'IA
- À l’ère du numérique, le réseau constitue non seulement un lien reliant le monde, mais également une force essentielle dans la promotion des entreprises et du progrès social. Avec la croissance explosive des appareils mobiles, de l'Internet des objets (IoT) et des services cloud, la dépendance des utilisateurs à l'égard du réseau a atteint des niveaux sans précédent. Un environnement réseau capable de fournir un accès sécurisé et efficace à tout moment et en tout lieu est devenu une nécessité pour les particuliers et les entreprises. Cependant, cette croissance de la demande entraîne également son lot de défis, notamment en termes de cybersécurité et de complexité de l’architecture des réseaux. Dans le dernier Magic Quadrant pour les interventions filaires et sans fil publié par Gartner cette année, HPE Aruba Networking a été une fois de plus récompensé pour ses solutions d'orchestration de réseau automatisée, sa technologie avancée de mise à niveau logicielle et ses fonctionnalités intégrées d'intelligence artificielle (IA).
- IA 821 2024-06-05 11:12:47
-
- L'atelier ECCV 2024 Compréhension multimodale et génération de vidéos de scénarios de cas difficiles de conduite autonome L'appel à communications et le défi sont maintenant ouverts !
- Page d'accueil de l'atelier : https://coda-dataset.github.io/w-coda2024/ Présentation Cet atelier vise à explorer l'écart entre la technologie de conduite autonome de pointe actuelle et les agents de conduite autonome intelligents complets et fiables. Ces dernières années, de grands modèles multimodaux (tels que GPT-4V) ont démontré des progrès sans précédent dans la perception et la compréhension multimodales. Utiliser les MLLM pour traiter des scénarios complexes de conduite autonome, en particulier des scénarios difficiles, rares mais critiques, est un défi non résolu. Cet atelier vise à promouvoir la recherche innovante sur la perception et la compréhension multimodales des grands modèles, l'application de la technologie avancée AIGC dans les systèmes de conduite autonome et la conduite autonome de bout en bout. Travail
- IA 1021 2024-06-04 20:47:35
-
- Vous pouvez comprendre les principes des réseaux de neurones convolutifs même sans fondement ! Hyper détaillé !
- Je crois que les amis qui aiment la technologie et qui s'intéressent beaucoup à l'IA comme l'auteur doivent être familiers avec les réseaux de neurones convolutifs et doivent avoir été confus par un nom aussi « avancé » depuis longtemps. L'auteur entrera aujourd'hui dans le monde des réseaux de neurones convolutifs à partir de zéro ~ partagez-le avec vous ! Avant de plonger dans les réseaux de neurones convolutifs, examinons le fonctionnement des images. Principe de l'image Les images sont représentées dans les ordinateurs par des nombres (0-255), et chaque nombre représente la luminosité ou les informations de couleur d'un pixel de l'image. Parmi eux : Image noir et blanc : Chaque pixel n'a qu'une seule valeur, et cette valeur varie entre 0 (noir) et 255 (blanc). Image couleur : chaque pixel contient trois valeurs, la plus courante est le modèle RVB (Rouge-Vert-Bleu), qui est rouge, vert et bleu.
- IA 551 2024-06-04 20:19:27
-
- 1,5 fois au-delà de la limite de diffraction, les conditions d'imagerie sont 10 fois inférieures, l'Université Tsinghua et l'Académie chinoise des sciences utilisent des méthodes d'IA pour améliorer la résolution du microscope
- Illustration : Imagerie SR à long terme de processus biologiques photosensibles rapides via ZS-DeconvNet. (Source : Article) Editeur | Les méthodes informatiques de super-résolution de la peau de carotte, y compris les algorithmes d'analyse traditionnels et les modèles d'apprentissage en profondeur, ont considérablement amélioré la microscopie optique. Parmi eux, les réseaux neuronaux profonds supervisés ont montré d'excellentes performances, mais en raison de la dynamique élevée des cellules vivantes, une grande quantité de données d'entraînement de haute qualité est nécessaire, et l'obtention de ces données est très laborieuse et peu pratique. Dans la dernière étude, des chercheurs de l’Université Tsinghua et de l’Académie chinoise des sciences ont développé des réseaux de déconvolution sans tir (ZS-DeconvNet) qui peuvent améliorer instantanément la résolution des images microscopiques au-delà du pôle de diffraction.
- IA 690 2024-06-04 19:26:15