OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus-KI-php.cn

Inhaltsverzeichnis

Derzeit weist diese Methode noch einige Einschränkungen auf, und OpenAI hofft, diese Probleme in zukünftigen Arbeiten zu lösen:# 🎜🎜 #

Heim

Technologie-Peripheriegeräte

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 25, 2023 pm 12:04 PM

Obwohl ChatGPT den Menschen der Wiederherstellung von Intelligenz näher zu bringen scheint, haben wir bisher nie vollständig verstanden, was Intelligenz ist, ob natürlich oder künstlich.

Es ist offensichtlich notwendig, die Prinzipien der Weisheit zu verstehen. Wie kann man die Intelligenz großer Sprachmodelle verstehen? Die von OpenAI gegebene Lösung lautet: Fragen Sie, was GPT-4 sagt.

Am 9. Mai veröffentlichte OpenAI seine neueste Forschung, die GPT-4 zur automatischen Interpretation des Verhaltens von Neuronen in großen Sprachmodellen verwendete und viele interessante Ergebnisse erzielte.

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

Ein einfacher Ansatz zur Interpretierbarkeitsforschung besteht darin, zunächst die KI zu verstehen Modell Was die verschiedenen Komponenten (Neuronen und Aufmerksamkeitsköpfe) tun. Bei herkömmlichen Methoden müssen Menschen Neuronen manuell untersuchen, um festzustellen, welche Merkmale der Daten sie darstellen. Dieser Prozess ist schwer zu skalieren und seine Anwendung auf neuronale Netze mit Hunderten oder Hunderten von Milliarden Parametern ist unerschwinglich teuer.

Also schlug OpenAI eine automatisierte Methode vor – mit GPT-4, um Erklärungen des Neuronenverhaltens in natürlicher Sprache zu generieren und zu bewerten und sie auf Neuronen in einem anderen Sprachmodell anzuwenden – hier sind sie wählte GPT-2 als experimentelle Probe und veröffentlichte einen Datensatz mit Interpretationen und Bewertungen dieser GPT-2-Neuronen.

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

Papieradresse: https:/ /openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html
GPT-2 Neuronendiagramm ： https://openaipublic.blob.core.windows.net/neuron-explainer/neuron-viewer/index.html
Code und Datensatz: https://github.com/openai/automated-interpretability

Diese Technologie ermöglicht es Menschen, die Vorteile von GPT zu nutzen – 4 zur Definition und automatischen Messung des quantitativen Konzepts der Interpretierbarkeit von KI-Modellen: Es wird verwendet, um die Fähigkeit von Sprachmodellen zu messen, neuronale Aktivierungen mithilfe natürlicher Sprache zu komprimieren und zu rekonstruieren. Aufgrund ihrer quantitativen Natur können wir nun den Fortschritt beim Verständnis der Rechenziele neuronaler Netze messen.

OpenAI sagte, dass mithilfe des von ihnen festgelegten Benchmarks und der Verwendung von KI zur Erklärung von KI Ergebnisse erzielt werden können, die nahe am menschlichen Niveau liegen. Greg Brockman, Mitbegründer von OpenAI, sagte auch, dass wir einen wichtigen Schritt in Richtung automatisierter Alignment-Forschung mit KI gemacht haben.

Spezifische Methode

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

Die Methode zur Verwendung von KI zur Erklärung von KI umfasst die Ausführung von drei Schritten für jedes Neuron: #🎜 🎜#

Schritt 1: Verwenden Sie GPT-4, um eine Erklärung zu generieren #

Generieren Sie bei einem gegebenen GPT-2-Neuron eine Erklärung seines Verhaltens durch Zeigt GPT-4-relevante Textsequenzen und Aktivierungen.

Vom Modell generierte Erklärungen: Verweise auf Filme, Charaktere und Unterhaltung.

Schritt 2: Verwenden Sie GPT-4 für die Simulation

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

erneut Simulieren Sie mit GPT-4, was das interpretierte Neuron tun würde.

Schritt 3: Vergleich

Erklärungen werden basierend darauf bewertet, wie gut simulierte Aktivierungen mit echten Aktivierungen übereinstimmen – in diesem Fall erzielte GPT-4 einen Wert von 0,34.

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

# 🎜 🎜#KeyFindings

Mithilfe seiner eigenen Bewertungsmethode begann OpenAI, die Wirksamkeit seiner Technologie in verschiedenen Teilen des Netzwerks zu messen, und versuchte, die Technologie für Teile zu verbessern, die derzeit unklar waren. Beispielsweise funktioniert ihre Technik bei größeren Modellen nicht gut, möglicherweise weil spätere Schichten schwieriger zu interpretieren sind.

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

OpenAI sagte, dass die überwiegende Mehrheit ihrer Erklärungen zwar nicht besonders gut abgeschnitten habe Sie glauben jedoch, dass sie jetzt ML-Techniken nutzen können, um ihre Fähigkeit, Erklärungen zu generieren, weiter zu verbessern. Sie stellten beispielsweise fest, dass Folgendes zur Verbesserung ihrer Punktzahl beitrug:

Iterative Erklärungen. Sie könnten ihre Ergebnisse verbessern, indem sie GPT-4 bitten, sich mögliche Gegenbeispiele auszudenken und dann die Erklärung basierend auf ihrer Aktivierung zu modifizieren.
Verwenden Sie zur Erklärung ein größeres Modell. Wenn sich die Fähigkeiten des Erklärmodells verbessern, steigt auch die durchschnittliche Punktzahl. Allerdings lieferte selbst GPT-4 schlechtere Erklärungen als Menschen, was darauf hindeutet, dass es Raum für Verbesserungen gibt.
Ändern Sie die Architektur des erklärten Modells. Das Training des Modells mit verschiedenen Aktivierungsfunktionen verbessert den Erklärungswert.

OpenAI sagte, dass sie einen von GPT-4 geschriebenen Datensatz und ein Visualisierungstool zusammenstellen, das alle 307.200 Neuronen in GPT-2 Open Source erklärt. Gleichzeitig stellen sie auch Code zur Interpretation und Bewertung mithilfe von Modellen bereit, die auf der OpenAI-API öffentlich verfügbar sind. Sie hoffen, dass die Forschungsgemeinschaft neue Techniken entwickeln wird, um Erklärungen mit höherer Punktzahl zu generieren, sowie bessere Werkzeuge zur Erforschung von GPT-2 durch Erklärungen.

Sie fanden heraus, dass es mehr als 1.000 Neuronen mit Erklärungswerten von mindestens 0,8 gab, was bedeutet, dass sie laut GPT-4 Activate die meisten Neuronen mit der höchsten Ränge ausmachten Verhalten. Die meisten dieser gut erklärten Neuronen sind nicht sehr interessant. Allerdings fanden sie auch viele interessante Neuronen, die GPT-4 nicht verstand. OpenAI hofft, dass mit der Verbesserung der Erklärungen schnell interessante qualitative Erkenntnisse zu Modellberechnungen gewonnen werden können.

Hier sind einige Beispiele für die Aktivierung von Neuronen in verschiedenen Schichten, wobei höhere Schichten abstrakter sind:

#🎜🎜 #

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

# 🎜🎜# OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

OpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus

Es scheint, dass die Konzepte, die GPT versteht, sich von denen des Menschen unterscheiden?

OpenAI Future Work

Derzeit weist diese Methode noch einige Einschränkungen auf, und OpenAI hofft, diese Probleme in zukünftigen Arbeiten zu lösen:# 🎜🎜 #

Diese Methode konzentriert sich auf kurze Erklärungen in natürlicher Sprache, aber Neuronen können sehr komplexe Verhaltensweisen aufweisen, die nicht prägnant beschrieben werden können; OpenAI hofft, irgendwann automatisch ganze neuronale Schaltkreise finden und erklären zu können, um komplexe Verhaltensweisen zu erreichen, wobei Neuronen und Aufmerksamkeitsköpfe zusammenarbeiten. Aktuelle Methoden interpretieren das Verhalten von Neuronen einfach als Funktion der Rohtexteingabe, ohne die nachgelagerten Auswirkungen zu berücksichtigen. Beispielsweise könnte ein Neuron, das über einen Zeitraum feuert, anzeigen, dass das nächste Wort mit einem Großbuchstaben beginnen sollte, oder einen Satzzähler erhöhen.
OpenAI erklärt das Verhalten des Neurons ohne zu versuchen, den Mechanismus zu erklären, der es erzeugt. Das bedeutet, dass selbst hoch bewertete Erklärungen bei nicht verbreiteten Texten möglicherweise schlecht abschneiden, weil sie lediglich einen Zusammenhang beschreiben; . Letztendlich hofft OpenAI, mithilfe von Modellen völlig allgemeine Hypothesen aufzustellen, zu testen und zu iterieren, so wie es Erklärbarkeitsforscher tun. Darüber hinaus hofft OpenAI, seine größten Modelle als eine Möglichkeit zu interpretieren, Ausrichtungs- und Sicherheitsprobleme vor und nach der Bereitstellung zu erkennen. Bis es soweit ist, ist es allerdings noch ein weiter Weg.

Das obige ist der detaillierte Inhalt vonOpenAI nutzt GPT-4, um die 300.000 Neuronen von GPT-2 zu erklären: So sieht Weisheit aus. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

3 Wochen vor By DDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

2 Wochen vor By DDD

Will R.E.P.O. Crossplay haben?

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7555

CakePHP-Tutorial

1384

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

CentOS Shutdown -Befehlszeile Apr 14, 2025 pm 09:12 PM

Der Befehl centOS stilldown wird heruntergefahren und die Syntax wird von [Optionen] ausgeführt [Informationen]. Zu den Optionen gehören: -h das System sofort stoppen; -P schalten Sie die Leistung nach dem Herunterfahren aus; -r neu starten; -t Wartezeit. Zeiten können als unmittelbar (jetzt), Minuten (Minuten) oder als bestimmte Zeit (HH: MM) angegeben werden. Hinzugefügten Informationen können in Systemmeldungen angezeigt werden.

Was sind die Backup -Methoden für Gitlab auf CentOS? Apr 14, 2025 pm 05:33 PM

Backup- und Wiederherstellungsrichtlinie von GitLab im Rahmen von CentOS -System Um die Datensicherheit und Wiederherstellung der Daten zu gewährleisten, bietet GitLab on CentOS eine Vielzahl von Sicherungsmethoden. In diesem Artikel werden mehrere gängige Sicherungsmethoden, Konfigurationsparameter und Wiederherstellungsprozesse im Detail eingeführt, um eine vollständige GitLab -Sicherungs- und Wiederherstellungsstrategie aufzubauen. 1. Manuell Backup Verwenden Sie den GitLab-RakegitLab: Backup: Befehl erstellen, um die manuelle Sicherung auszuführen. Dieser Befehl unterstützt wichtige Informationen wie GitLab Repository, Datenbank, Benutzer, Benutzergruppen, Schlüssel und Berechtigungen. Die Standardsicherungsdatei wird im Verzeichnis/var/opt/gitlab/backups gespeichert. Sie können /etc /gitlab ändern

So überprüfen Sie die CentOS -HDFS -Konfiguration Apr 14, 2025 pm 07:21 PM

Vollständige Anleitung zur Überprüfung der HDFS -Konfiguration in CentOS -Systemen In diesem Artikel wird die Konfiguration und den laufenden Status von HDFS auf CentOS -Systemen effektiv überprüft. Die folgenden Schritte helfen Ihnen dabei, das Setup und den Betrieb von HDFs vollständig zu verstehen. Überprüfen Sie die Hadoop -Umgebungsvariable: Stellen Sie zunächst sicher, dass die Hadoop -Umgebungsvariable korrekt eingestellt ist. Führen Sie im Terminal den folgenden Befehl aus, um zu überprüfen, ob Hadoop ordnungsgemäß installiert und konfiguriert ist: Hadoopsion-Check HDFS-Konfigurationsdatei: Die Kernkonfigurationsdatei von HDFS befindet sich im/etc/hadoop/conf/verzeichnis, wobei core-site.xml und hdfs-site.xml von entscheidender Bedeutung sind. verwenden

Wie ist die GPU -Unterstützung für Pytorch bei CentOS? Apr 14, 2025 pm 06:48 PM

Aktivieren Sie die Pytorch -GPU -Beschleunigung am CentOS -System erfordert die Installation von CUDA-, CUDNN- und GPU -Versionen von Pytorch. Die folgenden Schritte führen Sie durch den Prozess: Cuda und Cudnn Installation Bestimmen Sie die CUDA-Version Kompatibilität: Verwenden Sie den Befehl nvidia-smi, um die von Ihrer NVIDIA-Grafikkarte unterstützte CUDA-Version anzuzeigen. Beispielsweise kann Ihre MX450 -Grafikkarte CUDA11.1 oder höher unterstützen. Download und installieren Sie Cudatoolkit: Besuchen Sie die offizielle Website von Nvidiacudatoolkit und laden Sie die entsprechende Version gemäß der höchsten CUDA -Version herunter und installieren Sie sie, die von Ihrer Grafikkarte unterstützt wird. Installieren Sie die Cudnn -Bibliothek:

CentOS installieren MySQL Apr 14, 2025 pm 08:09 PM

Die Installation von MySQL auf CentOS umfasst die folgenden Schritte: Hinzufügen der entsprechenden MySQL Yum -Quelle. Führen Sie den Befehl mySQL-server aus, um den MySQL-Server zu installieren. Verwenden Sie den Befehl mySQL_SECURE_INSTALLATION, um Sicherheitseinstellungen vorzunehmen, z. B. das Festlegen des Stammbenutzerkennworts. Passen Sie die MySQL -Konfigurationsdatei nach Bedarf an. Tune MySQL -Parameter und optimieren Sie Datenbanken für die Leistung.

Detaillierte Erklärung des Docker -Prinzips Apr 14, 2025 pm 11:57 PM

Docker verwendet Linux -Kernel -Funktionen, um eine effiziente und isolierte Anwendungsumgebung zu bieten. Sein Arbeitsprinzip lautet wie folgt: 1. Der Spiegel wird als schreibgeschützte Vorlage verwendet, die alles enthält, was Sie für die Ausführung der Anwendung benötigen. 2. Das Union File System (UnionFS) stapelt mehrere Dateisysteme, speichert nur die Unterschiede, speichert Platz und beschleunigt. 3. Der Daemon verwaltet die Spiegel und Container, und der Kunde verwendet sie für die Interaktion. 4. Namespaces und CGroups implementieren Container -Isolation und Ressourcenbeschränkungen; 5. Mehrere Netzwerkmodi unterstützen die Containerverbindung. Nur wenn Sie diese Kernkonzepte verstehen, können Sie Docker besser nutzen.

CentOS8 startet SSH Apr 14, 2025 pm 09:00 PM

Der Befehl zum Neustart des SSH -Dienstes lautet: SystemCTL Neustart SSHD. Detaillierte Schritte: 1. Zugriff auf das Terminal und eine Verbindung zum Server; 2. Geben Sie den Befehl ein: SystemCTL Neustart SSHD; 1. Überprüfen Sie den Dienststatus: SystemCTL -Status SSHD.

Wie man eine verteilte Schulung von Pytorch auf CentOS betreibt Apr 14, 2025 pm 06:36 PM

Pytorch Distributed Training on CentOS -System erfordert die folgenden Schritte: Pytorch -Installation: Die Prämisse ist, dass Python und PIP im CentOS -System installiert sind. Nehmen Sie abhängig von Ihrer CUDA -Version den entsprechenden Installationsbefehl von der offiziellen Pytorch -Website ab. Für CPU-Schulungen können Sie den folgenden Befehl verwenden: PipinstallTorChTorChVisionTorChaudio Wenn Sie GPU-Unterstützung benötigen, stellen Sie sicher, dass die entsprechende Version von CUDA und CUDNN installiert ist und die entsprechende Pytorch-Version für die Installation verwenden. Konfiguration der verteilten Umgebung: Verteiltes Training erfordert in der Regel mehrere Maschinen oder mehrere Maschinen-Mehrfach-GPUs. Ort

See all articles