localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Terminateur réfléchissant ultra brillant ? Google NeRF-Casting : le lancer de rayons peut le faire !
- NeRF n'a plus « peur » des réflexions quasi spéculaires. Les premières variantes de NeRF utilisaient des perceptrons multicouches (MLP) pour cartographier les coordonnées 3D à la densité volumétrique et à la couleur dépendant du point de vue, mais la représentation détaillée de la géométrie 3D et de la couleur nécessitait une formation de grands MLP et une évaluation. extrêmement lent. Des travaux récents se sont concentrés sur l'amélioration de l'efficacité du NeRF en remplaçant les grands MLP par des structures de données de type grille voxel ou une combinaison de grilles et de petits MLP. Bien qu’évolutif pour représenter des scènes détaillées à grande échelle, ses avantages se limitent à une géométrie tridimensionnelle et à une couleur principalement diffuse. Étendre la capacité de NeRF à modéliser l'apparence de la réalité en fonction du point de vue reste un défi. Le modèle avancé actuel pour la synthèse de vues d'objets brillants présente des limites sur deux aspects : il ne peut synthétiser que la lumière ambiante distante.
- IA 1207 2024-06-07 09:27:53
-
- LLM | Yuan 2.0-M32 : modèle de mélange expert avec routage d'attention
- Image 1. La conclusion est écrite ci-dessus. Yuan+2.0-M32 est une infrastructure, similaire à Yuan-2.0+2B, utilisant une architecture hybride experte contenant 32 experts. 2 de ces experts sont actifs. Une architecture hybride experte contenant 32 experts est proposée et adoptée pour sélectionner les experts plus efficacement. Par rapport au modèle utilisant le réseau de routage classique, le taux de précision est amélioré de 3,8 %. Yuan+2.0-M32 est formé à partir de zéro, en utilisant 2 000 milliards de jetons, et sa consommation de formation n'est que de 9,25 % de celle d'un modèle d'ensemble dense de même taille de paramètre. Afin de mieux sélectionner les experts, le routeur d'attention est introduit, qui a la capacité de détecter rapidement et ainsi de permettre une meilleure sélection des experts. Yuan2.0-
- IA 603 2024-06-07 09:06:30
-
- Construire une loi d'échelle à partir de 80 modèles : un nouveau travail d'un doctorant chinois, fortement recommandé par l'auteur de la chaîne de réflexion
- Dans le domaine de l'IA, les lois de mise à l'échelle (Scalinglaws) sont un outil puissant pour comprendre les tendances de mise à l'échelle du LM. Elles fournissent une ligne directrice aux chercheurs. Cette loi constitue un guide important pour comprendre comment les performances des modèles de langage changent avec l'échelle. Mais malheureusement, l'analyse de mise à l'échelle n'est pas courante dans de nombreuses études comparatives et post-formation, car la plupart des chercheurs ne disposent pas des ressources informatiques nécessaires pour créer des lois de mise à l'échelle à partir de zéro, et les modèles ouverts sont formés sur trop peu d'échelles pour faire des prédictions de mise à l'échelle fiables. Des chercheurs de l'Université de Stanford, de l'Université de Toronto et d'autres institutions ont proposé une méthode d'observation alternative : les lois d'échelle observationnelles (Observational Scaling Laws), qui combinent les fonctions des modèles de langage (LM) avec des modèles croisés.
- IA 406 2024-06-06 20:40:36
-
- Remodeler l'expérience de « construction » du cloud à l'ère de l'IA générative
- À l’ère de l’IA générative, les changements dans le secteur du cloud computing s’accélèrent à tous les niveaux, et le moment de créer un nouveau cloud est arrivé. En tant que développeur, comment pouvons-nous nous adapter facilement aux innovations technologiques ? Comment saisir rapidement les opportunités des nouvelles technologies pour se lancer et se développer rapidement ? Rejoignez l'Amazon Cloud Technology China Summit 2024, un événement incontournable pour les développeurs, qui peut vous aider à répondre à vos questions et à obtenir des récompenses ! La technologie Amazon Cloud remodèle l'expérience de construction à pile unique de développement, d'exploitation, de maintenance et d'optimisation à l'ère de l'IA générative sur le cloud. Lors de ce sommet, nous vous proposerons un nouveau parcours d'exploration de l'IA générative pour les développeurs, y compris l'expérience des produits vedettes immersifs. , une formation pratique spéciale et des défis de pointe, une certification de compétences et un apprentissage gratuit, un partage technologique tourné vers l'avenir, un dialogue avec les leaders de la communauté mondiale, un marché créatif pour les développeurs, etc., aident les développeurs à profiter d'un nombre illimité
- IA 826 2024-06-06 18:48:01
-
- La préférence humaine est la règle ! La technologie d'alignement SPPO permet aux grands modèles de langage de se concurrencer et de se concurrencer eux-mêmes.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Richard Sutton a fait cette évaluation dans « TheBitterLesson » : « La leçon la plus importante que l'on puisse tirer de 70 ans de recherche sur l'intelligence artificielle est que les méthodes générales qui utilisent l'informatique finiront par est le plus efficace et présente l'avantage
- IA 447 2024-06-06 18:32:31
-
- Le modèle de représentation visuelle vHeat inspiré du transfert de chaleur physique est ici. Il tente de briser le mécanisme d'attention et présente à la fois une faible complexité et un champ de réception global.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article sont les membres originaux de VMamba. Le premier auteur, Wang Zhaozhi, est un doctorant formé conjointement en 2022 entre l'Université de l'Académie chinoise des sciences et le laboratoire de Pengcheng. Le co-auteur est Liu Yuesi, doctorant direct de l’Université de l’Académie chinoise des sciences en 2021. Leur principal axe de recherche est visuel
- IA 526 2024-06-06 17:28:46
-
- DenserRadar : détecteur de nuages de points radar à ondes millimétriques 4D basé sur un nuage de points LiDAR dense
- Titre original : DenserRadar : A4Dmillimeter-waveradarpointclouddetectorbasedondenseLiDARpointclouds Lien vers l'article : https://arxiv.org/pdf/2405.05131 Affiliation de l'auteur : Université Tsinghua Idée de l'article : Le radar à ondes millimétriques 4D (mmWave) est connu pour sa robustesse dans les environnements extrêmes, sa large plage de détection et la capacité de mesurer la vitesse et l’altitude a montré un potentiel significatif pour améliorer la perception lorsque les systèmes de conduite autonome sont confrontés à des situations difficiles. Cependant, les limitations inhérentes à la rareté et au bruit des nuages de points radar à ondes millimétriques 4D
- IA 769 2024-06-06 14:10:54
-
- Les résultats de l'évaluation du pouf grand modèle sont révélés, qui sont 19% supérieurs à ceux de la génération précédente 'Skylark'.
- Récemment, le grand modèle de pouf a été officiellement lancé lors de la Volcano Engine Power Conference. Alors que la tendance à la réduction des prix des grands modèles est promue à des prix ultra bas, les capacités des modèles Doubao ont également attiré l'attention de l'industrie. Dans une information produit de Volcano Engine, l'équipe Doubao Model a publié certains des résultats des tests internes de la première phase : sur les ensembles d'évaluation publics de 11 industries principales telles que MMLU, BBH, GSM8K, HumanEval, etc., le score total de Doubao-pro-4k Il a marqué 76,8 points, soit une augmentation de 19% par rapport aux 64,5 points du modèle de génération précédente Skylark 2. C'est également mieux que les autres modèles nationaux testés au cours de la même période. Cette évaluation a été achevée en mai de cette année et comprenait principalement neuf grands modèles de langage nationaux, dont Universal Model Pro, Skylark2 et
- IA 357 2024-06-06 13:45:41
-
- Yann LeCun : ViT est lent et inefficace. Le traitement des images en temps réel repose encore sur la convolution.
- A l'ère de l'unification des Transformers, est-il encore nécessaire d'étudier l'orientation CNN de la vision par ordinateur ? Au début de cette année, le grand modèle vidéo d'OpenAI, Sora, a rendu populaire l'architecture VisionTransformer (ViT). Depuis lors, un débat est en cours pour savoir qui est le plus puissant, ViT ou réseau neuronal convolutif (CNN) traditionnel. Récemment, Yann LeCun, lauréat du prix Turing et scientifique en chef de Meta, actif sur les réseaux sociaux, a également rejoint la discussion sur le différend entre ViT et CNN. La cause de cet incident était que Harald Schäfer, CTO de Comma.ai, faisait une démonstration de ses dernières recherches. Il (comme de nombreux chercheurs récents en IA) suit l'expression de Yann LeCun, bien que
- IA 1036 2024-06-06 13:25:02
-
- Sanofi s'associe à OpenAI et Formation Bio pour accélérer la découverte de médicaments liés à l'IA
- Editeur | Cette collaboration changera la donne pour l’industrie pharmaceutique. En combinant données, technologie d’intelligence artificielle et expertise en matière de développement de médicaments, ils visent à révolutionner la manière dont les nouveaux médicaments sont découverts et mis sur le marché. Paul Hudson, PDG de Sanofi, a déclaré : « Cette collaboration constitue une étape importante dans notre parcours visant à devenir une société pharmaceutique basée sur l'IA. » Brad Lightcap, COO d'OpenAI, a déclaré : « L'IA a un énorme potentiel pour accélérer le développement de médicaments.
- IA 535 2024-06-06 12:54:35
-
- Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution
- 01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection
- IA 903 2024-06-06 12:33:01
-
- L'Université Tsinghua a pris le relais et YOLOv10 est sorti : les performances ont été grandement améliorées et il figurait sur la hot list de GitHub
- La série de référence YOLO de systèmes de détection de cibles a une fois de plus reçu une mise à niveau majeure. Depuis la sortie de YOLOv9 en février de cette année, le relais de la série YOLO (YouOnlyLookOnce) a été passé entre les mains de chercheurs de l'Université Tsinghua. Le week-end dernier, la nouvelle du lancement de YOLOv10 a attiré l'attention de la communauté IA. Il est considéré comme un cadre révolutionnaire dans le domaine de la vision par ordinateur et est connu pour ses capacités de détection d'objets de bout en bout en temps réel, poursuivant l'héritage de la série YOLO en fournissant une solution puissante alliant efficacité et précision. Adresse de l'article : https://arxiv.org/pdf/2405.14458 Adresse du projet : https://github.com/THU-MIG/yo
- IA 1298 2024-06-06 12:20:45
-
- Pour améliorer l'utilisation des ensembles de données optiques, l'équipe Tianda a proposé un modèle d'IA pour améliorer l'effet de prédiction spectrale
- Editeur | Dead Leaf Butterfly Récemment, l'équipe du professeur agrégé Wu Liang et de l'académicien Yao Jianquan de l'Institut de laser et d'optoélectronique de l'Université de Tianjin et l'équipe du professeur Xiong Deyi du Laboratoire de traitement du langage naturel ont signalé une solution qui utilise un modèle d'apprentissage profond. avec entrée supplémentaire multifréquence pour améliorer l'effet de prédiction spectrale. Ce schéma peut améliorer la précision de la prédiction spectrale en utilisant des données d'entrée multifréquences. De plus, cette solution peut également réduire les interférences sonores dans le processus de prédiction spectrale, améliorant ainsi l'effet de prédiction. Cette solution peut améliorer l'utilisation des ensembles de données optiques existants et améliorer l'effet de prédiction des réponses spectrales correspondant aux structures de métasurface sans augmenter les coûts de formation. Les résultats de recherche pertinents sont intitulés « Enhancedspectrumpredictionusingdeep
- IA 620 2024-06-06 12:09:28
-
- Un seul grand modèle clairsemé de 4 090 inférables, 200 milliards, « Tiangong MoE » est open source
- Dans la vague des grands modèles, la formation et le déploiement de LLM à ensembles denses de pointe posent d'énormes défis en termes d'exigences informatiques et de coûts associés, en particulier à des échelles de dizaines ou de centaines de milliards de paramètres. Pour relever ces défis, les modèles clairsemés, tels que les modèles Mixture of Experts (MoE), sont devenus de plus en plus importants. Ces modèles offrent une alternative économiquement viable en distribuant le calcul à divers sous-modèles spécialisés, ou « experts », avec le potentiel d'égaler, voire de dépasser, les performances de modèles à ensemble dense avec de très faibles besoins en ressources. Le 3 juin, une autre nouvelle importante est venue du domaine des grands modèles open source : Kunlun Wanwei a annoncé le grand modèle open source Skywork-MoE de 200 milliards de dollars, qui réduit considérablement le coût d'inférence tout en maintenant de solides performances. Basé sur le précédent open source Skywo de Kunlun Wanwei
- IA 900 2024-06-05 22:14:46
-
- HuggingFace vous apprend à créer un modèle visuel SOTA
- Il y a eu le GPT-4o d'OpenAI auparavant, et la série des rois de Google a suivi. Les grands modèles multimodaux avancés sont arrivés sur le marché les uns après les autres. D'autres pratiquants ont été choqués et ont commencé à réfléchir à la manière de rattraper à nouveau ces super modèles. Dans cet article de HuggingFace et de l'Université de la Sorbonne en France, ils ont résumé les expériences clés en matière de création de grands modèles visuels et ont indiqué une voie à suivre pour les développeurs. Ces expériences illustrées couvrent de nombreux aspects tels que la sélection de l'architecture du modèle, les méthodes de formation et les données de formation. L'auteur donne un résumé détaillé après plusieurs comparaisons. Les points essentiels sont les suivants : Si vous souhaitez faire du bon travail dans de grands modèles visuels, le choix de l'architecture est très important. Le modèle de langage a un impact plus important sur les performances globales que le module visuel. L'adoption d'une stratégie de pré-formation par étapes est plus propice au renforcement des capacités du modèle. Les données de formation doivent inclure
- IA 906 2024-06-05 21:39:58