localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA

  • Le modèle de représentation visuelle vHeat inspiré du transfert de chaleur physique est ici. Il tente de briser le mécanisme d'attention et présente à la fois une faible complexité et un champ de réception global.
    Le modèle de représentation visuelle vHeat inspiré du transfert de chaleur physique est ici. Il tente de briser le mécanisme d'attention et présente à la fois une faible complexité et un champ de réception global.
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article sont les membres originaux de VMamba. Le premier auteur, Wang Zhaozhi, est un doctorant formé conjointement en 2022 entre l'Université de l'Académie chinoise des sciences et le laboratoire de Pengcheng. Le co-auteur est Liu Yuesi, doctorant direct de l’Université de l’Académie chinoise des sciences en 2021. Leur principal axe de recherche est visuel
    IA 700 2024-06-06 17:28:46
  • DenserRadar : détecteur de nuages ​​de points radar à ondes millimétriques 4D basé sur un nuage de points LiDAR dense
    DenserRadar : détecteur de nuages ​​de points radar à ondes millimétriques 4D basé sur un nuage de points LiDAR dense
    Titre original : DenserRadar : A4Dmillimeter-waveradarpointclouddetectorbasedondenseLiDARpointclouds Lien vers l'article : https://arxiv.org/pdf/2405.05131 Affiliation de l'auteur : Université Tsinghua Idée de l'article : Le radar à ondes millimétriques 4D (mmWave) est connu pour sa robustesse dans les environnements extrêmes, sa large plage de détection et la capacité de mesurer la vitesse et l’altitude a montré un potentiel significatif pour améliorer la perception lorsque les systèmes de conduite autonome sont confrontés à des situations difficiles. Cependant, les limitations inhérentes à la rareté et au bruit des nuages ​​de points radar à ondes millimétriques 4D
    IA 885 2024-06-06 14:10:54
  • Les résultats de l'évaluation du pouf grand modèle sont révélés, qui sont 19% supérieurs à ceux de la génération précédente 'Skylark'.
    Les résultats de l'évaluation du pouf grand modèle sont révélés, qui sont 19% supérieurs à ceux de la génération précédente 'Skylark'.
    Récemment, le grand modèle de pouf a été officiellement lancé lors de la Volcano Engine Power Conference. Alors que la tendance à la réduction des prix des grands modèles est promue à des prix ultra bas, les capacités des modèles Doubao ont également attiré l'attention de l'industrie. Dans une information produit de Volcano Engine, l'équipe Doubao Model a publié certains des résultats des tests internes de la première phase : sur les ensembles d'évaluation publics de 11 industries principales telles que MMLU, BBH, GSM8K, HumanEval, etc., le score total de Doubao-pro-4k Il a marqué 76,8 points, soit une augmentation de 19% par rapport aux 64,5 points du modèle de génération précédente Skylark 2. C'est également mieux que les autres modèles nationaux testés au cours de la même période. Cette évaluation a été achevée en mai de cette année et comprenait principalement neuf grands modèles de langage nationaux, dont Universal Model Pro, Skylark2 et
    IA 428 2024-06-06 13:45:41
  • Yann LeCun : ViT est lent et inefficace. Le traitement des images en temps réel repose encore sur la convolution.
    Yann LeCun : ViT est lent et inefficace. Le traitement des images en temps réel repose encore sur la convolution.
    A l'ère de l'unification des Transformers, est-il encore nécessaire d'étudier l'orientation CNN de la vision par ordinateur ? Au début de cette année, le grand modèle vidéo d'OpenAI, Sora, a rendu populaire l'architecture VisionTransformer (ViT). Depuis lors, un débat est en cours pour savoir qui est le plus puissant, ViT ou réseau neuronal convolutif (CNN) traditionnel. Récemment, Yann LeCun, lauréat du prix Turing et scientifique en chef de Meta, actif sur les réseaux sociaux, a également rejoint la discussion sur le différend entre ViT et CNN. La cause de cet incident était que Harald Schäfer, CTO de Comma.ai, faisait une démonstration de ses dernières recherches. Il (comme de nombreux chercheurs récents en IA) suit l'expression de Yann LeCun, bien que
    IA 1149 2024-06-06 13:25:02
  • Sanofi s'associe à OpenAI et Formation Bio pour accélérer la découverte de médicaments liés à l'IA
    Sanofi s'associe à OpenAI et Formation Bio pour accélérer la découverte de médicaments liés à l'IA
    Editeur | Cette collaboration changera la donne pour l’industrie pharmaceutique. En combinant données, technologie d’intelligence artificielle et expertise en matière de développement de médicaments, ils visent à révolutionner la manière dont les nouveaux médicaments sont découverts et mis sur le marché. Paul Hudson, PDG de Sanofi, a déclaré : « Cette collaboration constitue une étape importante dans notre parcours visant à devenir une société pharmaceutique basée sur l'IA. » Brad Lightcap, COO d'OpenAI, a déclaré : « L'IA a un énorme potentiel pour accélérer le développement de médicaments.
    IA 645 2024-06-06 12:54:35
  • Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution
    Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution
    01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection
    IA 1164 2024-06-06 12:33:01
  • L'Université Tsinghua a pris le relais et YOLOv10 est sorti : les performances ont été grandement améliorées et il figurait sur la hot list de GitHub
    L'Université Tsinghua a pris le relais et YOLOv10 est sorti : les performances ont été grandement améliorées et il figurait sur la hot list de GitHub
    La série de référence YOLO de systèmes de détection de cibles a une fois de plus reçu une mise à niveau majeure. Depuis la sortie de YOLOv9 en février de cette année, le relais de la série YOLO (YouOnlyLookOnce) a été passé entre les mains de chercheurs de l'Université Tsinghua. Le week-end dernier, la nouvelle du lancement de YOLOv10 a attiré l'attention de la communauté IA. Il est considéré comme un cadre révolutionnaire dans le domaine de la vision par ordinateur et est connu pour ses capacités de détection d'objets de bout en bout en temps réel, poursuivant l'héritage de la série YOLO en fournissant une solution puissante alliant efficacité et précision. Adresse de l'article : https://arxiv.org/pdf/2405.14458 Adresse du projet : https://github.com/THU-MIG/yo
    IA 1607 2024-06-06 12:20:45
  • Pour améliorer l'utilisation des ensembles de données optiques, l'équipe Tianda a proposé un modèle d'IA pour améliorer l'effet de prédiction spectrale
    Pour améliorer l'utilisation des ensembles de données optiques, l'équipe Tianda a proposé un modèle d'IA pour améliorer l'effet de prédiction spectrale
    Editeur | Dead Leaf Butterfly Récemment, l'équipe du professeur agrégé Wu Liang et de l'académicien Yao Jianquan de l'Institut de laser et d'optoélectronique de l'Université de Tianjin et l'équipe du professeur Xiong Deyi du Laboratoire de traitement du langage naturel ont signalé une solution qui utilise un modèle d'apprentissage profond. avec entrée supplémentaire multifréquence pour améliorer l'effet de prédiction spectrale. Ce schéma peut améliorer la précision de la prédiction spectrale en utilisant des données d'entrée multifréquences. De plus, cette solution peut également réduire les interférences sonores dans le processus de prédiction spectrale, améliorant ainsi l'effet de prédiction. Cette solution peut améliorer l'utilisation des ensembles de données optiques existants et améliorer l'effet de prédiction des réponses spectrales correspondant aux structures de métasurface sans augmenter les coûts de formation. Les résultats de recherche pertinents sont intitulés « Enhancedspectrumpredictionusingdeep
    IA 738 2024-06-06 12:09:28
  • Un seul grand modèle clairsemé de 4 090 inférables, 200 milliards, « Tiangong MoE » est open source
    Un seul grand modèle clairsemé de 4 090 inférables, 200 milliards, « Tiangong MoE » est open source
    Dans la vague des grands modèles, la formation et le déploiement de LLM à ensembles denses de pointe posent d'énormes défis en termes d'exigences informatiques et de coûts associés, en particulier à des échelles de dizaines ou de centaines de milliards de paramètres. Pour relever ces défis, les modèles clairsemés, tels que les modèles Mixture of Experts (MoE), sont devenus de plus en plus importants. Ces modèles offrent une alternative économiquement viable en distribuant le calcul à divers sous-modèles spécialisés, ou « experts », avec le potentiel d'égaler, voire de dépasser, les performances de modèles à ensemble dense avec de très faibles besoins en ressources. Le 3 juin, une autre nouvelle importante est venue du domaine des grands modèles open source : Kunlun Wanwei a annoncé le grand modèle open source Skywork-MoE de 200 milliards de dollars, qui réduit considérablement le coût d'inférence tout en maintenant de solides performances. Basé sur le précédent open source Skywo de Kunlun Wanwei
    IA 1029 2024-06-05 22:14:46
  • HuggingFace vous apprend à créer un modèle visuel SOTA
    HuggingFace vous apprend à créer un modèle visuel SOTA
    Il y a eu le GPT-4o d'OpenAI auparavant, et la série des rois de Google a suivi. Les grands modèles multimodaux avancés sont arrivés sur le marché les uns après les autres. D'autres pratiquants ont été choqués et ont commencé à réfléchir à la manière de rattraper à nouveau ces super modèles. Dans cet article de HuggingFace et de l'Université de la Sorbonne en France, ils ont résumé les expériences clés en matière de création de grands modèles visuels et ont indiqué une voie à suivre pour les développeurs. Ces expériences illustrées couvrent de nombreux aspects tels que la sélection de l'architecture du modèle, les méthodes de formation et les données de formation. L'auteur donne un résumé détaillé après plusieurs comparaisons. Les points essentiels sont les suivants : Si vous souhaitez faire du bon travail dans de grands modèles visuels, le choix de l'architecture est très important. Le modèle de langage a un impact plus important sur les performances globales que le module visuel. L'adoption d'une stratégie de pré-formation par étapes est plus propice au renforcement des capacités du modèle. Les données de formation doivent inclure
    IA 1006 2024-06-05 21:39:58
  • Cinq écoles d'apprentissage automatique que vous ne connaissez pas
    Cinq écoles d'apprentissage automatique que vous ne connaissez pas
    L'apprentissage automatique est une branche importante de l'intelligence artificielle qui donne aux ordinateurs la possibilité d'apprendre à partir de données et d'améliorer leurs capacités sans être explicitement programmés. L'apprentissage automatique a un large éventail d'applications dans divers domaines, de la reconnaissance d'images et du traitement du langage naturel aux systèmes de recommandation et à la détection des fraudes, et il change notre façon de vivre. Il existe de nombreuses méthodes et théories différentes dans le domaine de l'apprentissage automatique, parmi lesquelles les cinq méthodes les plus influentes sont appelées les « Cinq écoles d'apprentissage automatique ». Les cinq grandes écoles sont l’école symbolique, l’école connexionniste, l’école évolutionniste, l’école bayésienne et l’école analogique. 1. Le symbolisme, également connu sous le nom de symbolisme, met l'accent sur l'utilisation de symboles pour le raisonnement logique et l'expression des connaissances. Cette école de pensée estime que l'apprentissage est un processus de déduction inversée, à travers les connaissances existantes.
    IA 983 2024-06-05 20:51:22
  • Lancement du grand modèle Bytedance Beanbao, le service d'IA complet Volcano Engine aide les entreprises à se transformer intelligemment
    Lancement du grand modèle Bytedance Beanbao, le service d'IA complet Volcano Engine aide les entreprises à se transformer intelligemment
    Tan Dai, président de Volcano Engine, a déclaré que les entreprises qui souhaitent bien mettre en œuvre de grands modèles sont confrontées à trois défis clés : l'effet de modèle, le coût d'inférence et la difficulté de mise en œuvre : elles doivent disposer d'un bon support de base de grands modèles pour résoudre des problèmes complexes, et elles doivent également avoir une inférence à faible coût. Les services permettent d'utiliser largement de grands modèles, et davantage d'outils, de plates-formes et d'applications sont nécessaires pour aider les entreprises à mettre en œuvre des scénarios. ——Tan Dai, président de Huoshan Engine 01. Le grand modèle de pouf fait ses débuts et est largement utilisé. Le polissage de l'effet de modèle est le défi le plus critique pour la mise en œuvre de l'IA. Tan Dai a souligné que ce n'est que grâce à une utilisation intensive qu'un bon modèle peut être poli. Actuellement, le modèle Doubao traite 120 milliards de jetons de texte et génère 30 millions d'images chaque jour. Afin d'aider les entreprises à mettre en œuvre des scénarios de modèles à grande échelle, le modèle à grande échelle beanbao développé indépendamment par ByteDance sera lancé à travers le volcan.
    IA 1254 2024-06-05 19:59:21
  • Nouvelle recherche de NVIDIA : la longueur du contexte est sérieusement fausse et peu de performances 32K sont qualifiées
    Nouvelle recherche de NVIDIA : la longueur du contexte est sérieusement fausse et peu de performances 32K sont qualifiées
    Exposant impitoyablement le faux phénomène standard des grands modèles à « contexte long », la nouvelle recherche de NVIDIA a révélé que 10 grands modèles, dont GPT-4, génèrent des longueurs de contexte de 128 Ko, voire 1 Mo. Mais après quelques tests, le nouvel indicateur « contexte effectif » a considérablement diminué, et peu peuvent atteindre 32K. Le nouveau benchmark s'appelle RULER et comprend un total de 13 tâches réparties en quatre catégories : récupération, suivi multi-sauts, agrégation et questions et réponses. RULER définit la « longueur de contexte effective », qui est la longueur maximale à laquelle le modèle peut maintenir les mêmes performances que la ligne de base du Llama-7B à une longueur de 4K. La recherche a été jugée « très perspicace » par les universitaires. Après avoir vu cette nouvelle recherche, de nombreux internautes ont également voulu voir le contexte des joueurs royaux Claude et Gémeaux.
    IA 1200 2024-06-05 16:22:47
  • L'ensemble du processus de déploiement de Yolov sur iPhone ou terminal pratique
    L'ensemble du processus de déploiement de Yolov sur iPhone ou terminal pratique
    Le classique de la détection tant attendu connaît une autre vague d'attaques : YOLOv5. Parmi eux, YOLOv5 ne dispose pas de fichiers complets. Le plus important maintenant est de comprendre YOLOv4, qui bénéficiera beaucoup dans le domaine de la détection de cibles et peut être fortement amélioré dans certains scénarios. Aujourd'hui, nous analyserons YOLOv4 pour vous. Dans le prochain numéro, nous nous entraînerons à déployer YOLOv5 sur les téléphones Apple ou à le détecter en temps réel via la caméra du terminal ! 1. Examen technologique Il existe un grand nombre de fonctionnalités considérées pour améliorer la précision des réseaux de neurones convolutifs (CNN). Les combinaisons de ces caractéristiques doivent être testées pratiquement sur de grands ensembles de données et les résultats théoriquement validés. Certaines fonctions ne fonctionnent que sur certains modèles, certaines questions ne fonctionnent que sur certains modèles ou uniquement des problèmes à petite échelle.
    IA 600 2024-06-05 16:17:14
  • Une nouvelle chaîne de perception tridimensionnelle de l'intelligence incarnée, TeleAI et Shanghai AI Lab ont proposé un modèle incarné de fusion multiperspective 'SAM-E'
    Une nouvelle chaîne de perception tridimensionnelle de l'intelligence incarnée, TeleAI et Shanghai AI Lab ont proposé un modèle incarné de fusion multiperspective 'SAM-E'
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Lorsque nous récupérons une montre mécanique, nous voyons le cadran et les aiguilles de face, la couronne et le bracelet de côté, et lorsque nous ouvrons le dos de la montre. , nous verrons les engrenages et les mouvements complexes. Chaque perspective fournit des informations différentes, qui peuvent être combinées pour comprendre l’ensemble de l’objet opération.
    IA 608 2024-06-05 16:09:27

Recommandations d'outils

Code de contact du formulaire de message d'entreprise jQuery

Le code de contact du formulaire de message d'entreprise jQuery est un formulaire de message d'entreprise simple et pratique et le code de la page d'introduction contactez-nous.

Effets de lecture de boîte à musique HTML5 MP3

L'effet spécial de lecture de boîte à musique HTML5 MP3 est un lecteur de musique MP3 basé sur HTML5 + CSS3 pour créer de jolies émoticônes de boîte à musique et cliquer sur le bouton de commutation.

Effets spéciaux du menu de navigation d'animation de particules cool HTML5

L'effet de menu de navigation d'animation de particules cool HTML5 est un effet spécial qui change de couleur lorsque le menu de navigation est survolé par la souris.

Code d'édition par glisser-déposer du formulaire visuel jQuery

Le code d'édition par glisser-déposer du formulaire visuel jQuery est un formulaire visuel basé sur jQuery et le framework bootstrap.

Modèle Web de fournisseur de fruits et légumes biologiques Bootstrap5

Un modèle Web de fournisseur de fruits et légumes biologiques-Bootstrap5
Modèle d'amorçage
2023-02-03

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus
modèle de back-end
2023-02-02

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5
Modèle d'amorçage
2023-02-02

Modèle Web d'informations de CV simples Bootstrap4

Modèle Web d'informations de CV simples Bootstrap4
Modèle d'amorçage
2023-02-02

Matériau vectoriel d'éléments d'été mignons (EPS+PNG)

Il s'agit d'un joli matériau vectoriel d'éléments d'été, comprenant le soleil, un chapeau de soleil, un cocotier, un bikini, un avion, une pastèque, une crème glacée, une boisson fraîche, une bouée, des tongs, un ananas, une conque, une coquille, une étoile de mer, un crabe. , Citrons, crème solaire, lunettes de soleil, etc., le matériel est fourni aux formats EPS et PNG, y compris des aperçus JPG.
Matériau PNG
2024-05-09

Matériel vectoriel de quatre badges de graduation rouges 2023 (AI+EPS+PNG)

Il s'agit d'un matériau vectoriel de badge de remise des diplômes rouge 2023, quatre au total, disponible aux formats AI, EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-29

Oiseau chantant et chariot rempli de fleurs design matériel vectoriel de bannière de printemps (AI + EPS)

Il s'agit d'un matériau vectoriel de bannière printanière conçu avec des oiseaux chanteurs et un chariot rempli de fleurs. Il est disponible aux formats AI et EPS, y compris l'aperçu JPG.
image de bannière
2024-02-29

Matériau vectoriel de chapeau de graduation doré (EPS+PNG)

Il s'agit d'un matériau vectoriel de casquette de graduation dorée, disponible aux formats EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-27

Modèle de site Web d'entreprise de services de nettoyage et de réparation de décoration intérieure

Le modèle de site Web d'entreprise de services de nettoyage et d'entretien de décoration d'intérieur est un modèle de site Web à télécharger adapté aux sites Web promotionnels qui proposent des services de décoration, de nettoyage, d'entretien et d'autres organisations de services. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-05-09

Modèle de page de guide de CV personnel aux couleurs fraîches

Le modèle de page de guide de CV de candidature personnelle de correspondance de couleurs fraîches est un téléchargement de modèle Web de page de guide d'affichage de travail de CV de recherche d'emploi personnel adapté au style de correspondance de couleurs fraîches. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-29

Modèle Web de CV de travail créatif de concepteur

Le modèle Web de CV de travail créatif de concepteur est un modèle Web téléchargeable pour l'affichage de CV personnels adapté à divers postes de concepteur. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28

Modèle de site Web d'entreprise de construction d'ingénierie moderne

Le modèle de site Web d'entreprise d'ingénierie et de construction moderne est un modèle de site Web téléchargeable adapté à la promotion du secteur des services d'ingénierie et de construction. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28