La distance de Wasserstein, également connue sous le nom de distance de Earth Mover, est une méthode mathématique utilisée pour mesurer la distance entre deux distributions de probabilité. Par rapport aux méthodes traditionnelles de mesure de distance telles que la distance euclidienne, la distance de Wasserstein prend en compte de manière plus complète la similarité entre les distributions et la relation entre les distances géométriques, ce qui la rend plus adaptée à la description de la similarité d'ensembles de données de grande dimension. La distance de Wasserstein est calculée par le coût total minimum requis pour transformer une distribution en une autre. Ce coût peut être interprété comme l’effort requis pour déplacer la masse d’une distribution d’un endroit à un autre. Par conséquent, la distance de Wasserstein peut être considérée comme le coût du transfert de masse entre deux distributions. Cela rend la distance de Wasserstein largement utilisée dans de nombreux domaines, notamment le traitement d'images, le traitement du langage naturel, l'économie, etc. En considérant la similarité et la distance géométrique entre les distributions
La définition de la distance de Wasserstein repose sur la minimisation du coût nécessaire pour transformer une distribution en une autre. Ce coût peut être arbitraire, mais il fait généralement référence au coût de déplacement de la masse d'un emplacement à un autre dans une distribution, qui peut être exprimé comme le produit de la distance entre les deux emplacements et la masse. La valeur de la distance de Wasserstein est égale à la valeur minimale du coût de toutes les solutions de transformation possibles.
Mathématiquement, la distance de Wasserstein peut être définie comme :
W_p(mu,nu)=left(inf_{gammainGamma(mu,nu)}int_{mathbb{R}^d times mathbb{R}^ d} |x-y|^p dgamma(x,y)right)^{1/p}
Parmi eux, mu et nu sont deux distributions de probabilité, et Gamma(mu,nu) sont tous les facteurs qui convertissent mu en nu Un ensemble de distributions de probabilité, gamma(x,y) représente la probabilité de conversion correspondant à (x,y). Dans la distance de Wasserstein, p geq 1 est une constante, généralement p=1 ou p=2. Lorsque p = 1, la distance de Wasserstein est également appelée distance du terrassement car elle peut être considérée comme une mesure du nombre minimum d'opérations requises pour déplacer une distribution à une autre.
Pour mieux comprendre le concept de distance de Wasserstein, nous pouvons considérer un exemple simple : Supposons que nous ayons deux distributions de probabilité unidimensionnelles P et Q, qui sont respectivement dans les intervalles [0,1] et [0,5,1,5 ] uniformément réparti sur le dessus. Nous pouvons utiliser les bibliothèques Python et Scipy pour calculer la distance de Wasserstein entre elles.
import numpy as np from scipy.stats import wasserstein_distance # 定义两个概率分布 P 和 Q P = np.ones(100) / 100 Q = np.ones(100) / 100 Q[50:] = 0 # 计算它们之间的Distance de Wasserstein w_dist = wasserstein_distance(P, Q) print("Wasserstein distance:", w_dist)
Dans cet exemple, nous avons utilisé la bibliothèque numpy pour générer deux distributions de probabilité de 100 éléments, toutes deux uniformément distribuées. Ensuite, nous fixons les 50 derniers éléments de la deuxième distribution Q à 0 pour simuler sa distribution sur l'intervalle [0.5,1]. Enfin, nous calculons la distance de Wasserstein entre eux à l'aide de la fonction wasserstein_distance de la bibliothèque Scipy. Après avoir exécuté le code, nous pouvons obtenir le résultat :
Wasserstein distance: 0.5
Cela signifie que le coût minimum requis pour transformer la distribution P en distribution Q est de 0,5. Dans cet exemple, nous pouvons l'interpréter comme la distance minimale requise pour déplacer un monticule de longueur 0,5 dans une fosse de longueur 0,5.
En bref, la distance de Wasserstein est une méthode de mesure de la distance entre deux distributions de probabilité, qui prend en compte la relation entre la similarité et la distance géométrique entre les distributions. Il a de nombreuses applications, telles que les fonctions de perte dans les réseaux contradictoires génératifs (GAN) et les mesures de similarité dans la récupération d'images.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!