Maison Périphériques technologiques IA Application de fonctions de perte communes dans les réseaux de neurones jumeaux

Application de fonctions de perte communes dans les réseaux de neurones jumeaux

Jan 23, 2024 pm 01:06 PM
réseau de neurones artificiels

Application de fonctions de perte communes dans les réseaux de neurones jumeaux

Le réseau de neurones jumeaux est un réseau de neurones avec une structure à deux branches, qui est souvent utilisé pour les tâches de mesure de similarité, de classification et de récupération. Les deux branches d’un tel réseau ont la même structure et les mêmes paramètres. Une fois que l'entrée passe respectivement par deux branches, la similarité est calculée via la couche de mesure de similarité (telle que la distance euclidienne, la distance de Manhattan, etc.). Pendant l'entraînement, une fonction de perte contrastive ou une fonction de perte triplet est généralement utilisée.

La fonction de perte de contraste est une fonction de perte de classification binaire pour les réseaux neuronaux siamois. Elle vise à maximiser la similarité d'échantillons similaires à proximité de 1 et la similarité de différents types d'échantillons à proche de 0. Son expression mathématique est la suivante :

L_{con}(y,d)=ycdot d^2+(1-y)cdotmax(m-d,0)^2

Cette fonction de perte est utilisée pour mesurer deux similarités entre échantillons et optimisées selon la catégorie de l'échantillon. Parmi eux, y représente si l'échantillon appartient à la même catégorie, d représente la similarité des deux échantillons et m représente une valeur limite prédéfinie. Lorsque y=1, le but de la fonction de perte est de rendre d aussi petit que possible, même si deux échantillons de la même catégorie sont plus similaires. À ce stade, la valeur de la fonction de perte peut être exprimée par le carré de d, c'est-à-dire que la valeur de la fonction de perte est d^2. Lorsque y = 0, le but de la fonction de perte est de rendre d supérieur à m, même si les échantillons de deux catégories différentes sont aussi différents que possible. À ce stade, lorsque d est inférieur à m, la valeur de la fonction de perte est d^2, indiquant la similarité entre les échantillons ; lorsque d est supérieur à m, la valeur de la fonction de perte est 0, indiquant que la similarité entre les échantillons a dépassé le niveau prédéterminé. En supposant la valeur limite m, la perte n'est plus calculée

La fonction de perte triplet est une fonction de perte utilisée dans les réseaux de neurones jumeaux. Elle vise à minimiser la distance entre les échantillons du même type et à maximiser. la distance entre les échantillons de différents types. L'expression mathématique de cette fonction est la suivante :

L_{tri}(a,p,n)=max(|f(a)-f(p)|^2-|f(a)-f( n )|^2+margin,0)

Parmi eux, a représente l'échantillon d'ancrage, p représente le même type d'échantillon, n représente le type d'échantillon différent, f représente la couche d'extraction de caractéristiques du réseau neuronal siamois , |cdot| représente la distance euclidienne, margin Représente une valeur limite prédéfinie. Le but de la fonction de perte est de rendre la distance entre les échantillons du même type aussi petite que possible, et la distance entre les échantillons de types différents aussi grande que possible et supérieure à la marge. Lorsque la distance entre des échantillons du même type est inférieure à la distance des échantillons de types différents moins la marge, la valeur de la fonction de perte est 0 lorsque la distance des échantillons du même type est supérieure à la distance des échantillons de types différents ; moins la marge, la valeur de la fonction de perte est la différence entre les deux distances.

La fonction de perte de contraste et la fonction de perte de triplet sont toutes deux des fonctions de perte de réseau neuronal jumeau couramment utilisées. Leur objectif est de rendre les échantillons de la même catégorie aussi proches que possible dans l'espace des fonctionnalités et les échantillons de différentes catégories aussi éloignés que possible. dans l'espace des fonctionnalités. Dans les applications pratiques, une fonction de perte appropriée peut être sélectionnée en fonction de tâches et d'ensembles de données spécifiques, et combinée avec d'autres techniques (telles que l'amélioration des données, la régularisation, etc.) pour l'optimisation du modèle.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article chaud

Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Article chaud

Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Tags d'article chaud

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Explorez les concepts, les différences, les avantages et les inconvénients de RNN, LSTM et GRU Explorez les concepts, les différences, les avantages et les inconvénients de RNN, LSTM et GRU Jan 22, 2024 pm 07:51 PM

Explorez les concepts, les différences, les avantages et les inconvénients de RNN, LSTM et GRU

Définition et analyse structurelle du réseau neuronal flou Définition et analyse structurelle du réseau neuronal flou Jan 22, 2024 pm 09:09 PM

Définition et analyse structurelle du réseau neuronal flou

Une étude de cas sur l'utilisation du modèle LSTM bidirectionnel pour la classification de texte Une étude de cas sur l'utilisation du modèle LSTM bidirectionnel pour la classification de texte Jan 24, 2024 am 10:36 AM

Une étude de cas sur l'utilisation du modèle LSTM bidirectionnel pour la classification de texte

Calcul des opérandes à virgule flottante (FLOPS) pour les réseaux de neurones Calcul des opérandes à virgule flottante (FLOPS) pour les réseaux de neurones Jan 22, 2024 pm 07:21 PM

Calcul des opérandes à virgule flottante (FLOPS) pour les réseaux de neurones

réseau neuronal convolutif causal réseau neuronal convolutif causal Jan 24, 2024 pm 12:42 PM

réseau neuronal convolutif causal

Réseau de neurones jumeaux : analyse des principes et des applications Réseau de neurones jumeaux : analyse des principes et des applications Jan 24, 2024 pm 04:18 PM

Réseau de neurones jumeaux : analyse des principes et des applications

Étapes pour écrire un réseau neuronal simple à l'aide de Rust Étapes pour écrire un réseau neuronal simple à l'aide de Rust Jan 23, 2024 am 10:45 AM

Étapes pour écrire un réseau neuronal simple à l'aide de Rust

Débruitage d'image à l'aide de réseaux de neurones convolutifs Débruitage d'image à l'aide de réseaux de neurones convolutifs Jan 23, 2024 pm 11:48 PM

Débruitage d'image à l'aide de réseaux de neurones convolutifs

See all articles