Hergestellt von Big Data Digest
Im Juli schrieb Naomi Saphra, Postdoktorandin der New York University (NYU), einen Artikel mit dem Titel „Interpretability Creationism“, in dem sie die Beziehung zwischen stochastischem Gradientenabstieg (SGD) und Deep Learning aus evolutionärer Sicht erläuterte . Beziehung, und die Interpretationsperspektive regt zum Nachdenken an.
Zum Beispiel: „Genau wie das menschliche Steißbein haben einige Phänomene während des Modelltrainingsprozesses möglicherweise ihre ursprüngliche Rolle verloren und sind zu einer Existenz geworden, die degenerierten Organen ähnelt.“
„Ob es sich um die Untersuchung des Verhaltens von parasitären Küken oder um die interne Leistung neuronaler Netze handelt.“ Wenn Sie nicht berücksichtigen, wie sich das System entwickelt, wird es schwierig sein, wertvolle Informationen zu unterscheiden. „
Das Folgende ist der Originaltext, der ohne Änderung der ursprünglichen Bedeutung zusammengestellt wurde. Bitte genießen Sie es.
Vor Jahrhunderten betrachteten Europäer das Vorhandensein von Kuckuckseiern in Nestern als Ehre für nistende Vögel. Denn der nistende Vogel füttert seine „heiligen Gäste“ mit Begeisterung und noch fleißiger als seine eigenen (vertriebenen) Küken, ein Verhalten, das dem Geist christlicher Gastfreundschaft entspricht.
Im Jahr 1859 stellte Charles Darwin die optimistische, kooperative Vorstellung vom Verhalten von Vögeln in Frage, indem er den Finken untersuchte, einen weiteren gelegentlich parasitären Finken.
Ohne die Rolle des Kuckucks aus evolutionärer Sicht zu betrachten, ist es schwer zu erkennen, dass der nistende Vogel kein großzügiger Besitzer der Kuckucksküken ist, sondern ein unglückliches Opfer.
Wie der Evolutionsbiologe Theodosius Dobzhansky sagte: „Ohne das Licht der Evolution ist nichts in der Biologie verständlich.“
Während der stochastische Gradientenabstieg keine echte Form der biologischen Evolution ist, gibt es viele Ähnlichkeiten dazu die wissenschaftliche Methode in der Biologie, die oft erfordert, den Ursprung des Verhaltens eines Modells zu verstehen.
Ob Sie das Verhalten parasitärer Küken oder die interne Leistung neuronaler Netze untersuchen, es ist schwierig zu unterscheiden, welche Informationen wertvoll sind, ohne zu berücksichtigen, wie sich das System entwickelt.
Daher ist es bei der Analyse eines Modells wichtig, nicht nur auf den Zustand am Ende des Trainings zu achten, sondern auch auf die zahlreichen Zwischenkontrollpunkte während des Trainings. Solche Experimente sind minimal kostspielig, können aber zu aussagekräftigen Erkenntnissen führen, die helfen, das Verhalten des Modells besser zu verstehen und zu erklären.
Menschen sind kausale Denker und suchen gerne nach kausalen Zusammenhängen zwischen Dingen, auch wenn es an wissenschaftlichen Grundlagen mangelt.
Im Bereich NLP neigen Forscher auch dazu, eine interpretierbare kausale Erklärung für das beobachtete Verhalten zu liefern, aber diese Erklärung enthüllt möglicherweise nicht wirklich das Innenleben des Modells. Beispielsweise könnte man Interpretierbarkeitsartefakten wie syntaktischen Aufmerksamkeitsverteilungen oder selektiven Neuronen große Aufmerksamkeit schenken, aber in Wirklichkeit können wir nicht sicher sein, dass das Modell diese Verhaltensmuster tatsächlich verwendet.
Um dieses Problem zu lösen, kann die kausale Modellierung helfen. Wenn wir versuchen, in bestimmte Merkmale und Muster eines Modells einzugreifen (zu modifizieren oder zu manipulieren), um deren Auswirkungen auf das Verhalten des Modells zu testen, zielt dieser Eingriff möglicherweise nur auf bestimmte offensichtliche, spezifische Verhaltenstypen ab. Mit anderen Worten: Wenn wir versuchen zu verstehen, wie ein Modell bestimmte Merkmale und Muster verwendet, können wir möglicherweise nur einige dieser Verhaltensweisen beobachten und andere potenzielle, weniger offensichtliche Verhaltensweisen ignorieren.
Daher sind wir in der Praxis möglicherweise nur in der Lage, bestimmte Arten kleinerer Eingriffe an bestimmten Einheiten in der Darstellung durchzuführen, wodurch die Interaktionen zwischen Features nicht korrekt wiedergegeben werden.
Wenn wir versuchen, in bestimmte Merkmale und Muster des Modells einzugreifen (zu modifizieren oder zu manipulieren), um ihre Auswirkungen auf das Verhalten des Modells zu testen, können wir Verteilungsverschiebungen einführen. Erhebliche Verteilungsverschiebungen können zu unberechenbarem Verhalten führen. Warum sollten sie also nicht zu falschen Interpretierbarkeitsartefakten führen?
Anmerkung des Übersetzers: Die Verteilungsverschiebung bezieht sich auf den Unterschied zwischen den statistischen Regeln, die das Modell für die Trainingsdaten erstellt, und den Daten nach der Intervention. Dieser Unterschied kann dazu führen, dass sich das Modell nicht an die neue Datenverteilung anpassen kann und daher ein unregelmäßiges Verhalten zeigt.
Glücklicherweise können uns Methoden zur Untersuchung der biologischen Evolution helfen, einige der im Modell erzeugten Phänomene zu verstehen. Genau wie das menschliche Steißbein haben einige Phänomene während des Modelltrainingsprozesses möglicherweise ihre ursprüngliche Rolle verloren und sich in etwas Ähnliches wie ein rudimentäres Organ verwandelt. Einige Phänomene können voneinander abhängig sein, zum Beispiel kann das Auftreten bestimmter Merkmale zu Beginn des Trainings die spätere Entwicklung anderer Merkmale beeinflussen, genauso wie Tiere grundlegende Lichtwahrnehmungsfähigkeiten benötigen, bevor sie komplexe Augen entwickeln können.
Es gibt auch einige Phänomene, die auf die Konkurrenz zwischen Merkmalen zurückzuführen sein können. Beispielsweise verlassen sich Tiere mit starken Geruchsfähigkeiten möglicherweise nicht stark auf das Sehvermögen, sodass ihre Sehfähigkeiten möglicherweise geschwächt sind. Darüber hinaus können einige Phänomene nur Nebenwirkungen des Trainingsprozesses sein, ähnlich wie die Junk-DNA in unserem Genom. Sie nehmen einen großen Teil des Genoms ein, haben jedoch keinen direkten Einfluss auf unser Aussehen und unsere Funktion.
Während des Trainings des Modells können einige ungenutzte Phänomene auftreten, und wir haben viele Theorien, um dieses Phänomen zu erklären. Die Informationsengpass-Hypothese sagt beispielsweise voraus, dass Eingabeinformationen zu Beginn des Trainings gespeichert und dann im Modell komprimiert werden, sodass nur für die Ausgabe relevante Informationen erhalten bleiben. Diese frühen Erinnerungen sind möglicherweise nicht immer nützlich, wenn man unsichtbare Daten verarbeitet, aber sie sind sehr wichtig, um schließlich eine bestimmte Ausgabedarstellung zu lernen.
Wir können auch die Möglichkeit degenerierter Merkmale in Betracht ziehen, da das frühe und späte Verhalten des trainierten Modells sehr unterschiedlich ist. Frühe Modelle waren einfacher. Am Beispiel von Sprachmodellen ähneln frühe Modelle einfachen N-Gramm-Modellen, während spätere Modelle komplexere Sprachmuster ausdrücken können. Diese Vermischung im Trainingsprozess kann Nebenwirkungen haben, die leicht mit einem kritischen Teil des Modelltrainings verwechselt werden können.
Es ist sehr schwierig, die Lerntendenz eines Modells nur anhand der Funktionen nach dem Training zu verstehen. Laut der Arbeit von Lovering et al. hat die Beobachtung der Leichtigkeit der Merkmalsextraktion zu Beginn des Trainings und die Analyse der Feinabstimmungsdaten einen viel tieferen Einfluss auf das Verständnis der Feinabstimmungsleistung als die bloße Analyse am Ende des Trainings.
Sprachschichtiges Verhalten ist eine typische Erklärung, die auf analytischen statischen Modellen basiert. Es wurde argumentiert, dass Wörter, die in der Satzstruktur nahe beieinander liegen, im Modell näher dargestellt werden, während Wörter, die strukturell weiter voneinander entfernt sind, weiter voneinander entfernt dargestellt werden. Woher wissen wir also, dass das Modell Wörter nach ihrer Nähe in der Satzstruktur gruppiert?
Tatsächlich können wir mit größerer Sicherheit sagen, dass einige Sprachmodelle hierarchisch sind, da frühe Modelle mehr lokale Informationen in Netzwerken mit langem Kurzzeitgedächtnis (LSTM) und Transformern codieren, und wenn diese Abhängigkeiten auf bekannte kurze Komponenten geschichtet werden, können sie Erlernen Sie weiter entfernte Abhängigkeiten leichter.
Bei der Auseinandersetzung mit dem Problem des interpretativen Kreationismus ist ein konkreter Fall aufgetreten. Beim mehrmaligen Trainieren eines Textklassifizierers mit verschiedenen Zufallsstartwerten kann beobachtet werden, dass das Modell in mehrere verschiedene Cluster verteilt ist. Es wurde auch festgestellt, dass das Generalisierungsverhalten eines Modells vorhergesagt werden kann, indem beobachtet wird, wie gut das Modell mit anderen Modellen auf der Verlustoberfläche verbunden ist. Mit anderen Worten: Je nachdem, wo sich der Verlust auf der Oberfläche befindet, kann die Generalisierungsleistung des Modells variieren. Dieses Phänomen hängt möglicherweise mit den während des Trainings verwendeten zufälligen Startwerten zusammen.
Aber kann man das wirklich sagen? Was wäre, wenn ein Cluster tatsächlich einer frühen Phase des Modells entspricht? Wenn ein Cluster tatsächlich nur eine frühe Phase des Modells darstellt, werden diese Modelle möglicherweise irgendwann zu einem Cluster mit besserer Generalisierungsleistung wechseln. Daher deuten die beobachteten Phänomene in diesem Fall lediglich darauf hin, dass einige Feinabstimmungsprozesse langsamer sind als andere.
Es muss gezeigt werden, dass Trainingstrajektorien in ein Becken auf der Verlustoberfläche fallen können, wodurch die Vielfalt des Generalisierungsverhaltens in trainierten Modellen erklärt wird. Tatsächlich wurde nach der Untersuchung mehrerer Kontrollpunkte während des Trainings festgestellt, dass ein Modell im Zentrum eines Clusters während des Trainings stärkere Verbindungen mit anderen Modellen in seinem Cluster aufbaut. Einige Modelle können jedoch immer noch erfolgreich zu einem besseren Cluster wechseln.
Für die Beantwortung der Forschungsfrage reicht die bloße Beobachtung des Trainingsprozesses nicht aus. Bei der Suche nach Kausalzusammenhängen ist ein Eingreifen erforderlich. Nehmen wir zum Beispiel Studien zur Antibiotikaresistenz in der Biologie. Forscher müssen Bakterien gezielt Antibiotika aussetzen und können sich nicht auf natürliche Experimente verlassen. Daher bedürfen Aussagen, die auf Beobachtungen der Trainingsdynamik basieren, einer experimentellen Bestätigung.
Nicht alle Aussagen erfordern eine Beobachtung des Trainingsprozesses. In den Augen der alten Menschen hatten viele Organe offensichtliche Funktionen, etwa Augen zum Sehen und das Herz zum Pumpen von Blut. Im Bereich der Verarbeitung natürlicher Sprache (NLP) können wir durch die Analyse statischer Modelle einfache Interpretationen vornehmen, z. B. dass bestimmte Neuronen bei Vorhandensein bestimmter Attribute feuern oder dass bestimmte Arten von Informationen noch im Modell verfügbar sind.
Beobachtungen des Trainingsprozesses können jedoch immer noch die Bedeutung vieler Beobachtungen klären, die in statischen Modellen gemacht wurden. Dies bedeutet, dass zwar nicht alle Probleme eine Beobachtung des Trainingsprozesses erfordern, es jedoch in vielen Fällen hilfreich ist, den Trainingsprozess zu verstehen, um die Beobachtungen zu verstehen.
Der Rat ist einfach: Konzentrieren Sie sich beim Studieren und Analysieren eines trainierten Modells nicht nur auf die Endergebnisse während des Trainingsprozesses. Stattdessen sollte die Analyse während des Trainings auf mehrere Zwischenkontrollpunkte angewendet werden; bei der Feinabstimmung des Modells sollten mehrere Punkte zu Beginn und am Ende des Trainings überprüft werden. Es ist wichtig, Veränderungen im Modellverhalten während des Trainings zu beobachten, was Forschern helfen kann, besser zu verstehen, ob die Modellstrategie sinnvoll ist, und die Modellstrategie zu bewerten, nachdem sie beobachtet haben, was zu Beginn des Trainings passiert.
Referenzlink: https://thegradient.pub/interpretability-creationism/
Das obige ist der detaillierte Inhalt vonDie Brillanz von SGD bringt die Bedeutung von Deep Learning zum Ausdruck. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!