In TensorFlow bezieht sich der Begriff „Logits“ auf unskalierte Ausgaben vorhergehender Schichten, die eine lineare relative Skalierung darstellen. Sie werden häufig in Modellen des maschinellen Lernens verwendet, um die präprobabilistischen Aktivierungen vor der Anwendung einer Softmax-Funktion darzustellen.
Unterschied zwischen Softmax und softmax_cross_entropy_with_logits
Softmax (tf.nn.softmax) wendet die Softmax-Funktion auf Eingabetensoren an und wandelt Log-Wahrscheinlichkeiten (Logits) in Wahrscheinlichkeiten zwischen 0 und 1 um. Die Ausgabe behält die gleiche Form wie die Eingabe.
softmax_cross_entropy_with_logits (tf.nn.softmax_cross_entropy_with_logits) kombiniert den Softmax-Schritt und die Berechnung des Kreuzentropieverlusts in einem Vorgang. Es bietet einen mathematisch fundierteren Ansatz zur Optimierung des Kreuzentropieverlusts mit Softmax-Schichten. Die Ausgabeform dieser Funktion ist kleiner als die Eingabe, wodurch eine zusammenfassende Metrik erstellt wird, die über die Elemente summiert.
Beispiel
Betrachten Sie das folgende Beispiel:
<code class="python">import tensorflow as tf # Create logits logits = tf.constant([[0.1, 0.3, 0.5, 0.9]]) # Apply softmax softmax_output = tf.nn.softmax(logits) # Compute cross-entropy loss and softmax loss = tf.nn.softmax_cross_entropy_with_logits(logits, tf.one_hot([0], 4)) print(softmax_output) # [[ 0.16838508 0.205666 0.25120102 0.37474789]] print(loss) # [[0.69043917]]</code>
Softmax_output stellt die Wahrscheinlichkeiten für jede Klasse dar, während der Verlustwert den Kreuzentropieverlust zwischen den Logits und den bereitgestellten Labels darstellt.
Wann man softmax_cross_entropy_with_logits verwenden sollte
Es wird empfohlen, tf.nn.softmax_cross_entropy_with_logits für Optimierungsszenarien zu verwenden, in denen die Ausgabe Ihres Modells Softmaxed ist. Diese Funktion gewährleistet numerische Stabilität und macht manuelle Anpassungen überflüssig.
Das obige ist der detaillierte Inhalt von## Was ist der Unterschied zwischen Softmax und softmax_cross_entropy_with_logits in TensorFlow?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!