Table des matières
01 Aperçu d'Outlook
02 Contexte et motivation
03 Nouvelle recherche d'algorithmes
04 Expérience et visualisation
Maison Périphériques technologiques IA Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Jun 06, 2024 pm 12:33 PM
算法 检测

01 Aperçu d'Outlook

Actuellement, il est difficile de trouver un équilibre approprié entre l'efficacité de la détection et les résultats de la détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse.

02 Contexte et motivation

Avec le développement rapide de la technologie de télédétection, les images de télédétection optique haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. La détection d'objets joue un rôle essentiel dans l'interprétation des images de télédétection et peut être utilisée pour la segmentation, la description et le suivi de cibles des images de télédétection. Cependant, en raison de leur champ de vision relativement large et de leurs exigences en matière d'altitude élevée, les images aériennes de télédétection optique présentent une diversité d'échelle, de spécificité de point de vue, d'orientation aléatoire et de complexité d'arrière-plan élevée, alors que la plupart des ensembles de données traditionnels contiennent des vues terrestres. En conséquence, les techniques utilisées pour construire une détection artificielle de caractéristiques présentent traditionnellement de grandes différences en termes de précision et de vitesse. En raison des besoins de la société et du soutien au développement de l’apprentissage profond, l’utilisation de réseaux de neurones pour la détection de cibles dans les images de télédétection optique est nécessaire.

Actuellement, les algorithmes de détection de cibles qui combinent l'apprentissage profond pour analyser les photos de télédétection optique peuvent être divisés en trois types : supervisés, non supervisés et faiblement supervisés. Cependant, en raison de la complexité et de l’incertitude des algorithmes non supervisés et faiblement supervisés, les algorithmes supervisés sont les algorithmes les plus couramment utilisés. De plus, les algorithmes de détection d'objets supervisés peuvent être divisés en une ou deux étapes. En partant de l'hypothèse que les avions sont généralement situés dans des aéroports et que les navires sont généralement situés dans des ports et des océans, la détection des aéroports et des ports dans des images d'étoiles sous-échantillonnées, puis la cartographie des objets découverts avec les images satellite originales à ultra haute résolution peuvent détecter des objets de différentes tailles simultanément. Certains chercheurs ont proposé une méthode de détection de cible rotative basée sur RCNN, qui améliore la précision de la détection de cible dans les images de télédétection en résolvant le problème de randomisation des directions des cibles.

03 Nouvelle recherche d'algorithmes

La plupart des têtes de détection actuelles de la série YOLO sont basées sur les caractéristiques de sortie du FPN et du PAFPN. Parmi eux, les réseaux basés sur FPN, tels que YOLOv3, et leurs variantes sont présentés dans la figure. a ci-dessous. Ils utilisent directement la fonction de fusion unidirectionnelle pour la sortie. YOLOv4 et YOLOv5 basés sur l'algorithme PAFPN ajoutent sur cette base un canal de bas niveau à haut niveau, qui transmet directement les signaux de bas niveau vers le haut (b ci-dessous).

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Comme le montre la figure ci-dessus, dans certaines études, une tête de détection a été ajoutée pour des tâches de détection spécifiques dans le modèle TPH-YOLOv5. Dans les figures b et c ci-dessus, seule la fonction PAFPN peut être utilisée pour la sortie, tandis que la fonction FPN n'est pas entièrement utilisée. Par conséquent, YOLOv7 connecte trois têtes auxiliaires à la sortie FPN, comme le montre la figure d ci-dessus, bien que les têtes auxiliaires ne soient utilisées que pour une « sélection grossière » et aient une évaluation de poids inférieure. La tête de détection SSD est proposée pour améliorer la conception trop grossière du jeu d'ancres du réseau YOLO, et propose une conception d'ancre dense basée sur plusieurs échelles. Comme le montre la figure f, cette stratégie peut utiliser simultanément les informations sur les fonctionnalités de PANet et de FPN. De plus, il existe un processus de sous-échantillonnage 64x qui ajoute directement la sortie, ce qui permet au réseau de contenir des informations globales précédentes.

La méthode des têtes de détection multiples peut utiliser efficacement les fonctionnalités de sortie du réseau. YOLO amélioré est un réseau de détection d'objets pour les photos de télédétection haute résolution. Comme le montre la figure ci-dessous :

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

La structure de base du réseau fédérateur est un réseau dense CSP avec des modules C3 et de convolution comme noyau. Après l'augmentation des données, les images sont introduites dans le réseau et après le mélange des canaux par le module Conv avec une taille de noyau 6, de nombreux modules convolutifs effectuent la récupération des fonctionnalités. Après un module d’amélioration des fonctionnalités appelé SPPF, ils sont connectés au PANet de Neck. Afin d'améliorer la capacité de détection du réseau, une fusion bidirectionnelle de fonctionnalités est effectuée. Conv2d est utilisé pour étendre indépendamment les couches de fonctionnalités fusionnées afin de générer des sorties multicouches. Comme le montre la figure ci-dessous, l'algorithme NMS combine les sorties de tous les détecteurs monocouche pour générer la trame de détection finale.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

La figure b ci-dessous décrit la composition structurelle de chaque module du réseau YOLO amélioré.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Conv comprend une couche de convolution 2D, une normalisation par lots de la couche BN et une fonction d'activation Silu, C3 comprend deux couches de convolution 2D et une couche de goulot d'étranglement, et Upsample est une couche de suréchantillonnage. Le module SPPF est une version accélérée du module SPP, le module MAB est comme mentionné ci-dessus et l'ECA est comme indiqué dans le coin inférieur gauche. Après un regroupement moyen global au niveau du canal sans réduction de dimensionnalité, des convolutions 1D rapides de taille k sont utilisées pour capturer des informations d'interaction locale entre canaux, en tenant compte de la relation de chaque canal avec ses k voisins, réalisant ainsi efficacement l'ECA. Les deux transformations ci-dessus collectent des caractéristiques le long de deux directions spatiales pour produire une paire de cartes de caractéristiques sensibles à la direction, qui sont ensuite concaténées et modifiées à l'aide de fonctions de convolution et sigmoïdes pour fournir une sortie d'attention.

04 Expérience et visualisation

L'ensemble de données SIMD est un ensemble de données de détection d'objets de télédétection multi-catégories, open source et haute résolution, contenant un total de 15 catégories, comme le montre la figure 4. De plus, l'ensemble de données SIMD est plus distribué dans les cibles de petite et moyenne taille (w

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Vous pouvez connecter la sortie du module SPPF à l'en-tête de sortie pour identifier les grandes cibles dans l'image. Cependant, la sortie du module SPPF a plusieurs connexions et implique des cibles à plusieurs échelles. Son utilisation directe pour la tête de détection afin d'identifier de gros objets entraînera une mauvaise représentation du modèle, comme le montre la figure ci-dessus, montrant avant et après l'ajout du module SPPF. Module MAB Comparaison visuelle des cartes thermiques de certains résultats de détection. Après avoir ajouté le module MAB, la tête de détection se concentre sur la détection de grandes cibles et attribue la prédiction des petites cibles à d'autres têtes de prédiction, ce qui améliore l'effet d'expression du modèle et est plus conforme aux exigences de division des têtes de détection en fonction de la cible. taille dans l'algorithme YOLO.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Certains résultats de tests sont présentés dans l'image ci-dessus. À en juger par chaque résultat de détection, il n'y a pas beaucoup de différence avec les autres algorithmes. Cependant, par rapport aux autres algorithmes, l'algorithme que nous avons étudié améliore l'effet de détection du modèle tout en garantissant que la consommation de temps n'augmente pas de manière significative et utilise le mécanisme d'attention pour. Améliorer l'effet d'expression du modèle.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
<🎜>: Grow A Garden - Guide de mutation complet
3 Il y a quelques semaines By DDD
Nordhold: Système de fusion, expliqué
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel Java
1672
14
Tutoriel PHP
1276
29
Tutoriel C#
1256
24
Solution au i7-7700 impossible de passer à Windows 11 Solution au i7-7700 impossible de passer à Windows 11 Dec 26, 2023 pm 06:52 PM

Les performances du i77700 sont tout à fait suffisantes pour exécuter Win11, mais les utilisateurs constatent que leur i77700 ne peut pas être mis à niveau vers Win11. Cela est principalement dû aux restrictions imposées par Microsoft, ils peuvent donc l'installer tant qu'ils ignorent cette restriction. Le i77700 ne peut pas être mis à niveau vers win11 : 1. Parce que Microsoft limite la version du processeur. 2. Seules les versions Intel de huitième génération et supérieures peuvent directement passer à Win11. 3. En tant que 7ème génération, i77700 ne peut pas répondre aux besoins de mise à niveau de Win11. 4. Cependant, le i77700 est tout à fait capable d'utiliser Win11 en douceur en termes de performances. 5. Vous pouvez donc utiliser le système d'installation directe win11 de ce site. 6. Une fois le téléchargement terminé, cliquez avec le bouton droit sur le fichier et « chargez-le ». 7. Double-cliquez pour exécuter l'opération "Un clic

CLIP-BEVFormer : superviser explicitement la structure BEVFormer pour améliorer les performances de détection à longue traîne CLIP-BEVFormer : superviser explicitement la structure BEVFormer pour améliorer les performances de détection à longue traîne Mar 26, 2024 pm 12:41 PM

Écrit ci-dessus et compréhension personnelle de l'auteur : À l'heure actuelle, dans l'ensemble du système de conduite autonome, le module de perception joue un rôle essentiel. Le véhicule autonome roulant sur la route ne peut obtenir des résultats de perception précis que via le module de perception en aval. dans le système de conduite autonome, prend des jugements et des décisions comportementales opportuns et corrects. Actuellement, les voitures dotées de fonctions de conduite autonome sont généralement équipées d'une variété de capteurs d'informations de données, notamment des capteurs de caméra à vision panoramique, des capteurs lidar et des capteurs radar à ondes millimétriques pour collecter des informations selon différentes modalités afin d'accomplir des tâches de perception précises. L'algorithme de perception BEV basé sur la vision pure est privilégié par l'industrie en raison de son faible coût matériel et de sa facilité de déploiement, et ses résultats peuvent être facilement appliqués à diverses tâches en aval.

Explorez les principes sous-jacents et la sélection d'algorithmes de la fonction de tri C++ Explorez les principes sous-jacents et la sélection d'algorithmes de la fonction de tri C++ Apr 02, 2024 pm 05:36 PM

La couche inférieure de la fonction de tri C++ utilise le tri par fusion, sa complexité est O(nlogn) et propose différents choix d'algorithmes de tri, notamment le tri rapide, le tri par tas et le tri stable.

Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Jun 03, 2024 pm 01:25 PM

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

L'intelligence artificielle peut-elle prédire la criminalité ? Explorez les capacités de CrimeGPT L'intelligence artificielle peut-elle prédire la criminalité ? Explorez les capacités de CrimeGPT Mar 22, 2024 pm 10:10 PM

La convergence de l’intelligence artificielle (IA) et des forces de l’ordre ouvre de nouvelles possibilités en matière de prévention et de détection de la criminalité. Les capacités prédictives de l’intelligence artificielle sont largement utilisées dans des systèmes tels que CrimeGPT (Crime Prediction Technology) pour prédire les activités criminelles. Cet article explore le potentiel de l’intelligence artificielle dans la prédiction de la criminalité, ses applications actuelles, les défis auxquels elle est confrontée et les éventuelles implications éthiques de cette technologie. Intelligence artificielle et prédiction de la criminalité : les bases CrimeGPT utilise des algorithmes d'apprentissage automatique pour analyser de grands ensembles de données, identifiant des modèles qui peuvent prédire où et quand les crimes sont susceptibles de se produire. Ces ensembles de données comprennent des statistiques historiques sur la criminalité, des informations démographiques, des indicateurs économiques, des tendances météorologiques, etc. En identifiant les tendances qui pourraient échapper aux analystes humains, l'intelligence artificielle peut donner du pouvoir aux forces de l'ordre.

Le dernier chef-d'œuvre du MIT : utiliser GPT-3.5 pour résoudre le problème de la détection des anomalies des séries chronologiques Le dernier chef-d'œuvre du MIT : utiliser GPT-3.5 pour résoudre le problème de la détection des anomalies des séries chronologiques Jun 08, 2024 pm 06:09 PM

Aujourd'hui, j'aimerais vous présenter un article publié par le MIT la semaine dernière, utilisant GPT-3.5-turbo pour résoudre le problème de la détection des anomalies des séries chronologiques et vérifiant dans un premier temps l'efficacité du LLM dans la détection des anomalies des séries chronologiques. Il n'y a pas de réglage fin dans l'ensemble du processus et GPT-3.5-turbo est utilisé directement pour la détection des anomalies. Le cœur de cet article est de savoir comment convertir des séries temporelles en entrées pouvant être reconnues par GPT-3.5-turbo et comment concevoir. des invites ou des pipelines pour laisser LLM résoudre la tâche de détection des anomalies. Permettez-moi de vous présenter une introduction détaillée à ce travail. Titre de l'article image : Largelangagemodelscanbezero-shotanomalydete

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution Jun 06, 2024 pm 12:33 PM

01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection

Application d'algorithmes dans la construction de 58 plateformes de portraits Application d'algorithmes dans la construction de 58 plateformes de portraits May 09, 2024 am 09:01 AM

1. Contexte de la construction de la plateforme 58 Portraits Tout d'abord, je voudrais partager avec vous le contexte de la construction de la plateforme 58 Portraits. 1. La pensée traditionnelle de la plate-forme de profilage traditionnelle ne suffit plus. La création d'une plate-forme de profilage des utilisateurs s'appuie sur des capacités de modélisation d'entrepôt de données pour intégrer les données de plusieurs secteurs d'activité afin de créer des portraits d'utilisateurs précis. Elle nécessite également l'exploration de données pour comprendre le comportement et les intérêts des utilisateurs. et besoins, et fournir des capacités côté algorithmes ; enfin, il doit également disposer de capacités de plate-forme de données pour stocker, interroger et partager efficacement les données de profil utilisateur et fournir des services de profil. La principale différence entre une plate-forme de profilage d'entreprise auto-construite et une plate-forme de profilage de middle-office est que la plate-forme de profilage auto-construite dessert un seul secteur d'activité et peut être personnalisée à la demande. La plate-forme de mid-office dessert plusieurs secteurs d'activité et est complexe ; modélisation et offre des fonctionnalités plus générales. 2.58 Portraits d'utilisateurs de l'arrière-plan de la construction du portrait sur la plate-forme médiane 58

See all articles