La reconnaissance d'image est basée sur les principales caractéristiques de l'image. Chaque image a ses caractéristiques. Les recherches sur les mouvements oculaires lors de la reconnaissance d'images montrent que la ligne de visée est toujours focalisée sur les principales caractéristiques de l'image, c'est-à-dire sur les endroits où le contour de l'image présente la plus grande courbure ou là où la direction de l'image est la plus grande. le contour change soudainement. La quantité d'informations est la plus grande et le parcours de balayage des yeux passe toujours d'un élément à l'autre en séquence.
L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.
La technologie de reconnaissance d'images est un domaine important de l'intelligence artificielle. Il fait référence à la technologie de reconnaissance d'objets sur des images pour identifier des cibles et des objets de différents modes.
Le développement de la reconnaissance d'images est passé par trois étapes : la reconnaissance de texte, le traitement et la reconnaissance d'images numériques et la reconnaissance d'objets. La reconnaissance d'images, comme son nom l'indique, consiste à effectuer divers traitements et analyses sur des images, et enfin à identifier la cible que l'on souhaite étudier. La reconnaissance d'images dont on parle aujourd'hui ne se limite pas à l'utilisation de l'œil humain, mais à la reconnaissance à l'aide de la technologie informatique.
Principes de la technologie de reconnaissance d'image
Il n'y a pas de différence de principe essentielle entre la technologie de reconnaissance d'image informatique et la reconnaissance d'image humaine. La reconnaissance d'image humaine repose sur la classification des caractéristiques inhérentes de l'image, puis la classe à travers. chaque catégorie Les caractéristiques de l'image sont utilisées pour l'identifier. Lorsque nous voyons une image, notre cerveau détectera rapidement si nous avons vu cette image ou une image similaire.
Dans ce processus, notre cerveau identifiera en fonction des catégories qui ont été classées dans la mémoire stockée pour voir s'il existe une mémoire stockée avec des caractéristiques identiques ou similaires à celles de l'image, identifiant ainsi si l'image a été vue.
La technologie de reconnaissance d'image peut être basée sur les principales caractéristiques de l'image. Chaque image a ses propres caractéristiques, comme la lettre A a une pointe, P a un cercle et le centre de Y a un angle aigu, etc. Les recherches sur les mouvements oculaires lors de la reconnaissance d'images montrent que la ligne de visée est toujours focalisée sur les principales caractéristiques de l'image, c'est-à-dire sur les endroits où la courbure du contour de l'image est la plus grande ou où la direction du contour change soudainement, où la quantité d'informations est la plus grande. De plus, le trajet de balayage de l’œil passe toujours d’une caractéristique à l’autre en séquence. On peut voir que dans le processus de reconnaissance d'image, le mécanisme de perception doit éliminer les informations redondantes d'entrée et extraire les informations clés. Dans le même temps, il doit exister dans le cerveau un mécanisme responsable de l’intégration des informations, capable d’organiser les informations obtenues par étapes en une image perceptuelle complète.
La reconnaissance de formes est une partie importante de l'intelligence artificielle et des sciences de l'information. La reconnaissance de formes fait référence au processus d'analyse et de traitement de différentes formes d'informations représentant des choses ou des phénomènes pour obtenir une description, une identification et une classification de choses ou de phénomènes.
La technologie de reconnaissance d'images est basée sur les principales caractéristiques des images. Chaque image a ses caractéristiques. Les recherches sur les mouvements oculaires lors de la reconnaissance d'images montrent que la ligne de visée est toujours focalisée sur les principales caractéristiques de l'image, c'est-à-dire sur les endroits où le contour de l'image présente la plus grande courbure ou là où la direction de l'image est la plus grande. le contour change soudainement. La plus grande quantité d’informations. De plus, le trajet de balayage de l’œil passe toujours d’une caractéristique à l’autre en séquence. On peut voir que dans le processus de reconnaissance d'image, le mécanisme de perception doit éliminer les informations redondantes d'entrée et extraire les informations clés. Dans le même temps, il doit exister dans le cerveau un mécanisme responsable de l'intégration des informations, capable d'organiser les informations obtenues par étapes en une image perceptuelle complète.
Le processus de la technologie de reconnaissance d'image
Étant donné que la technologie de reconnaissance d'image informatique repose sur les mêmes principes que la reconnaissance d'image humaine, leurs processus sont également similaires. Le processus de la technologie de reconnaissance d'images est divisé en les étapes suivantes : acquisition d'informations, prétraitement, extraction et sélection de caractéristiques, conception du classificateur et prise de décision en matière de classification.
L'acquisition d'informations fait référence à la conversion d'informations telles que la lumière ou le son en informations électriques grâce à des capteurs. Il s’agit d’obtenir les informations de base de l’objet de recherche et de les transformer en informations que la machine peut comprendre grâce à une méthode.
Le prétraitement fait principalement référence à des opérations telles que le débruitage, le lissage et la transformation dans le traitement de l'image, améliorant ainsi les caractéristiques importantes de l'image.
L'extraction et la sélection de fonctionnalités font référence à la nécessité d'extraire et de sélectionner des fonctionnalités dans la reconnaissance de formes. La compréhension simple est que les images que nous étudions sont de différents types. Si nous voulons utiliser une méthode pour les distinguer, nous devons les identifier grâce à leurs propres caractéristiques, et le processus d'obtention de ces caractéristiques est l'extraction de caractéristiques.
Les fonctionnalités obtenues lors de l'extraction de fonctionnalités peuvent ne pas être toutes utiles pour cette reconnaissance. À l'heure actuelle, les fonctionnalités utiles doivent être extraites. L'extraction et la sélection de caractéristiques sont l'une des technologies les plus critiques du processus de reconnaissance d'images. La compréhension de cette étape est donc au centre de la reconnaissance d'images.
Quelles sont les applications de la technologie de reconnaissance d'images ?
La reconnaissance d'images est divisée en reconnaissance biométrique, reconnaissance d'objets et de scènes et reconnaissance vidéo. La reconnaissance biométrique comprend les empreintes digitales, la forme de la paume, les yeux (rétine et iris), la forme du visage, etc. ; la reconnaissance d'objets et de scènes comprend : la signature, la voix, la démarche de marche, l'intensité de frappe au clavier, etc.
La reconnaissance d'images est un problème complet, couvrant la correspondance d'images, la classification d'images, la récupération d'images, la détection de visages, la détection de piétons et d'autres technologies, et a de nombreuses applications dans les moteurs de recherche Internet, la conduite autonome, l'analyse médicale, l'analyse de télédétection et d'autres domaines de valeur. .
Pour plus de connaissances connexes, veuillez visiter la rubrique FAQ !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!