Maison Périphériques technologiques IA L'Université de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

L'Université de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Sep 11, 2023 pm 06:53 PM
理论 perception visuelle Lumière visible - Imagerie infrarouge thermique

Ces dernières années, l'exploration de l'évaluation de la sécurité des systèmes de perception visuelle s'est progressivement approfondie. Les chercheurs ont mis en œuvre avec succès une technologie d'évaluation de la sécurité en mode lumière visible basée sur différents supports tels que des lunettes, des autocollants, des vêtements, etc., et il y a également quelques nouvelles tentatives. ciblant les modes infrarouges. Mais ils ne peuvent fonctionner que dans un seul mode.


Avec le développement de la technologie de l'intelligence artificielle, la technologie d'imagerie infrarouge thermique à lumière visible a été utilisée dans de nombreuses tâches critiques pour la sécurité telles que la surveillance de la sécurité et la conduite autonome. Parmi elles, l'imagerie par lumière visible peut fournir des informations riches sur les textures pendant la conduite. le jour, tandis que l'imagerie infrarouge peut afficher clairement la répartition du rayonnement thermique de la cible la nuit. La combinaison des deux apporte de nombreux avantages tels qu'une couverture complète de 24 heures et l'absence de limitations environnementales au système de perception visuelle. Par conséquent, il est également nécessaire d’étudier de toute urgence une méthode unifiée d’évaluation de la sécurité pour les systèmes de perception visuelle multimodaux.

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Cependant, réaliser une évaluation multimodale est extrêmement difficile. Tout d’abord, il est difficile d’appliquer universellement des méthodes d’attaque sous différents mécanismes d’imagerie. Les méthodes précédentes ont été proposées sur la base des caractéristiques d’imagerie de modalités cibles spécifiques et sont difficiles à appliquer dans d’autres modalités. De plus, il est difficile d’équilibrer les performances furtives, les coûts de production et la flexibilité des applications. Il n'est pas facile d'être efficace à la fois dans la lumière visible et dans le mode infrarouge, plus difficile, et il est encore plus difficile de parvenir à une production et une utilisation pratiques et peu coûteuses.

Confrontés à de nombreux défis, des chercheurs de l'Institut d'intelligence artificielle Beihang ont exploré les attributs de forme communs entre les modes lumière visible et infrarouge et ont proposé de manière innovante un « patch de contre-mesure universel multimodal » pour obtenir une synchronisation lumière visible-infrarouge Invisible . Il sélectionne des matériaux faciles à obtenir, peu coûteux et dotés d'excellentes propriétés d'isolation thermique pour créer des patchs pratiques, prêts à l'emploi. Il comble non seulement les lacunes de la technologie d'évaluation de la robustesse de la détection multimodale lumière visible-infrarouge. systèmes dans le monde physique actuel, mais prend également en compte la simplicité et l’immédiateté de la mise en œuvre physique. Les expériences démontrent l’efficacité de cette méthode sous différents modèles et modalités de détection, ainsi que sa généralisation dans de multiples scénarios. Actuellement, cet article a été accepté par l'ICCV 2023.
LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.


Lien de papier: https://arxiv.org/abs/2307.07859
code Lien: https://github.com/aries-iai/cross-modal_patch_attack

technical Points

Cette recherche utilise l'algorithme évolutif comme cadre de base, basé sur les trois perspectives de modélisation de forme, d'optimisation de forme et d'équilibre modal pour réaliser la conception du schéma et l'amélioration des effets. Le processus spécifique est tel qu'illustré dans la figure :
.
LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

1. Modélisation de forme multi-ancres basée sur l'interpolation spline

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.
Pour la partie de modélisation de forme de base, les chercheurs ont conçu un nouveau paradigme de modélisation d'optimisation de points, qui peut directement ajuster la forme du patch en modifiant les coordonnées du point. Dans ce processus, le mouvement du point d'ancrage ne sera pas limité par la direction, la distance, etc., augmentant ainsi l'espace de recherche des formes de patch. Sur cette base, afin de garantir le naturel de la forme, il utilise également la méthode d'interpolation spline pour obtenir des connexions fluides, et les splines suivront de plus près les points de contrôle.

2. Algorithme d'optimisation de forme limité par les limites basé sur l'évolution différentielle

La mise en œuvre d'attaques nécessite des méthodes d'optimisation efficaces Pour cette raison, les chercheurs considèrent les algorithmes évolutifs comme le cadre de base du point de vue du coût du temps et des effets pratiques. , etc. Et des améliorations sont apportées sous les deux angles de la définition des limites et de la fonction de remise en forme :

(1) Définition des limites : la définition des limites pour les points d'ancrage améliore l'efficacité de la déformation et réduit les coûts de temps. Il possède les paramètres suivants : les boucles ou les auto-intersections ne seront pas formées dans le segment de courbe ; les cuspides n'apparaîtront pas facilement dans le segment de courbe et elles n'apparaîtront pas dans les zones non valides ;

En prenant le point d'ancrage LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge. comme exemple, la partie bleue dans l'image ci-dessous est la légende de définition des limites, et la partie orange est l'exemple d'erreur :

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.
À propos de la détermination des limites du point d'ancrage LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge. L'expression mathématique est la suivante :

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.
(2) Fonction Fitness : Contrairement aux travaux précédents qui ne ciblent qu'un seul mode pour l'évaluation de l'attaque, ce travail se concentre sur les deux modes de lumière visible et infrarouge, et il existe naturellement des différences dans les effets du problème des modes équilibrés. Par conséquent, afin d'éviter d'aller à l'extrême en optimisant facilement un seul mode, les chercheurs ont proposé de manière innovante une fonction de fitness intermodale basée sur la perception du score de confiance du détecteur, encourageant l'exploration de directions réussies tout en équilibrant la différence entre les effets des deux. modes, et enfin la survie du plus fort en fonction des scores. Compte tenu de la différence de difficulté d'attaque entre l'étape initiale et l'étape ultérieure, il utilise une fonction exponentielle au lieu d'une fonction linéaire pour mettre en évidence la différence de progression de l'attaque aux différentes étapes. L'algorithme itère le processus d'exploration jusqu'à ce que les deux modes attaquent avec succès et génèrent la stratégie de forme optimale.Le processus d'optimisation complet est le suivant :

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Résultats expérimentaux

Expérience 1 : Vérification des performances d'attaque multimodale pour différentes séries de détecteurs

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Expérience 2 : Expérience d'ablation pour la forme

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Expérience 3 : Expérience d'ablation pour la fonction de fitness intermodale

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Expérience 4 : Robustesse de la méthode vérification sous écart physique de mise en œuvre

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

Expérience 5 : Vérification de l'efficacité de la méthode dans différentes conditions physiques

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.

LUniversité de Beihang brise les barrières modales et introduit une méthode universelle de contre-attaque physique dans les modes visible et infrarouge.
Résultats visualisés de la vérification des performances sous différents angles, distances, postures et scénarios

Résumé

Une méthode d'évaluation de la robustesse multimodale visible-infrarouge dans des environnements physiques est conçue. Ce procédé peut évaluer la robustesse d'un système de détection de cible multimodal (lumière visible-infrarouge), corriger efficacement le modèle de détecteur sur la base des résultats de l'évaluation, et améliorer simultanément la précision de la détection d'image cible dans les modes lumière visible et infrarouge. physique Il peut être véritablement mis en œuvre et appliqué dans l'environnement, et contribuer à l'évaluation de la robustesse et à l'amélioration des systèmes de détection multimodaux.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Jul 26, 2024 pm 05:38 PM

Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Jul 26, 2024 am 08:40 AM

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Jul 26, 2024 pm 02:40 PM

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Aug 22, 2024 pm 04:37 PM

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.

Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Aug 08, 2024 pm 09:22 PM

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont ​​développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Jul 25, 2024 am 06:42 AM

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire. Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire. Jun 22, 2024 am 06:43 AM

Éditeur | L’utilisation de Ziluo AI pour rationaliser la découverte de médicaments explose. Ciblez des milliards de molécules candidates pour détecter celles qui pourraient posséder les propriétés nécessaires au développement de nouveaux médicaments. Il y a tellement de variables à prendre en compte, depuis le prix des matériaux jusqu’au risque d’erreur, qu’évaluer les coûts de synthèse des meilleures molécules candidates n’est pas une tâche facile, même si les scientifiques utilisent l’IA. Ici, les chercheurs du MIT ont développé SPARROW, un cadre d'algorithme de prise de décision quantitative, pour identifier automatiquement les meilleurs candidats moléculaires, minimisant ainsi les coûts de synthèse tout en maximisant la probabilité que les candidats possèdent les propriétés souhaitées. L’algorithme a également identifié les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules. SPARROW prend en compte le coût de synthèse d'un lot de molécules à la fois, puisque plusieurs molécules candidates sont souvent disponibles

Les performances de SOTA, la méthode d'IA de prédiction d'affinité protéine-ligand multimodale de Xiamen, combinent pour la première fois des informations sur la surface moléculaire Les performances de SOTA, la méthode d'IA de prédiction d'affinité protéine-ligand multimodale de Xiamen, combinent pour la première fois des informations sur la surface moléculaire Jul 17, 2024 pm 06:37 PM

Editeur | KX Dans le domaine de la recherche et du développement de médicaments, il est crucial de prédire avec précision et efficacité l'affinité de liaison des protéines et des ligands pour le criblage et l'optimisation des médicaments. Cependant, les études actuelles ne prennent pas en compte le rôle important des informations sur la surface moléculaire dans les interactions protéine-ligand. Sur cette base, des chercheurs de l'Université de Xiamen ont proposé un nouveau cadre d'extraction de caractéristiques multimodales (MFE), qui combine pour la première fois des informations sur la surface des protéines, la structure et la séquence 3D, et utilise un mécanisme d'attention croisée pour comparer différentes modalités. alignement. Les résultats expérimentaux démontrent que cette méthode atteint des performances de pointe dans la prédiction des affinités de liaison protéine-ligand. De plus, les études d’ablation démontrent l’efficacité et la nécessité des informations sur la surface des protéines et de l’alignement des caractéristiques multimodales dans ce cadre. Les recherches connexes commencent par "S

See all articles