Achetez-moi un café☕
*Mon article explique la classification des images (reconnaissance), la localisation d'objets, la détection d'objets et la segmentation d'images.
Computer Vision est la technologie qui permet à un ordinateur de comprendre et d'analyser des éléments visuels tels que des images, des vidéos, etc.
(1) Détection de points clés (détection de points de repère) :
- peut localiser les points distinctifs des objets ou des régions d'intérêt dans une image :
*Mémos :
- L'image peut représenter une image dans une vidéo.
-
La Localisation d'objet ou Classification d'image et Localisation d'objet(Détection d'objet) est utilisée.
- peut être utilisé pour reconnaître le visage, son émotion, la pose de la personne, les vêtements, etc.
(2) Correspondance d'images :
- peut déterminer que les objets et les régions d'intérêt dans plusieurs images sont identiques ou similaires en comparant leurs points distinctifs.
- est la technologie avancée de Détection de points clés.
- peut être utilisé pour faire correspondre des visages, des empreintes digitales, etc.
(3) Suivi d'objet :
- peut suivre les objets et les régions d'intérêt dans une vidéo (plusieurs images capturées en séquence) avec des cadres de délimitation. *La vidéo peut être constituée de plusieurs images capturées en séquence.
- est la technologie avancée de Détection d'objets.
- est utilisé pour la surveillance, les véhicules autonomes, la réalité virtuelle, la fabrication, les magasins sans personnel, etc.
(4) Flux Optique :
- peut détecter et visualiser le mouvement (vitesse) des objets et des régions d'intérêt dans une vidéo (plusieurs images capturées en séquence) :
*Mémos :
- La vitesse est la vitesse et la direction d'un objet en mouvement.
- La vidéo peut être constituée de plusieurs images capturées en séquence.
- est la technologie ramifiée du Suivi d'objets.
- est utilisé pour la surveillance, la surveillance du trafic, l'analyse de mouvement, etc.
(5) Correspondance stéréo :
- peut créer une scène 3D à partir de deux ou plusieurs images stéréo 2D en calculant la disparité :
*Mémos :
- Une image stéréo 2D est une image similaire prise depuis une position différente.
- La disparité est la distance entre deux ou plusieurs pixels correspondants dans les images stéréo.
- est utilisé pour la robotique.
(6) La prédiction vidéo peut prédire les images vidéo futures à partir des images vidéo passées.
(7) Sous-titrage des images :
- peut générer des descriptions textuelles pour les images.
- est l'IA générative qui est la combinaison de la vision par ordinateur et du traitement du langage naturel (NLP).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!