Heim Technologie-Peripheriegeräte KI Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Apr 24, 2023 pm 04:04 PM
chatgpt 论文

Nachdem ChatGPT populär wurde, stellen viele Studenten, die sich mit Technologie beschäftigen, eine Frage: Gibt es Lernmaterialien, die es uns ermöglichen, die Prinzipien von ChatGPT systematisch zu verstehen? Dieses Problem wird schwierig, da OpenAI kein Papier zu ChatGPT veröffentlicht hat.

Aus dem Blog von OpenAI über ChatGPT wissen wir jedoch, dass die von ChatGPT verwendete Methode dieselbe ist wie ihr Brudermodell InstructGPT, mit der Ausnahme, dass InstructGPT in GPT-3 enthalten ist , während ChatGPT auf GPT-3.5 basiert. Auch hinsichtlich der Datenerhebung gibt es einige Unterschiede zwischen den beiden.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Blog-Link: https://openai.com /blog/chatgpt/

InstructGPTs Artikel wurde im März 2022 veröffentlicht, aber OpenAI veröffentlichte bereits im Januar einen entsprechenden Blog (siehe „GPT -3 What Was tun, wenn Sie Unsinn reden? OpenAI: Wir haben es neu trainiert und die neue Version ist „gehorsamer“). Damals erwähnte OpenAI deutlich, dass InstructGPT die Reinforcement-Learning-Methode des menschlichen Feedbacks (RLHF) verwendet, um GPT-3 zu verfeinern, wodurch die Ausgabe des Modells besser mit den menschlichen Vorlieben übereinstimmt. Dies wurde im Training von ChatGPT fortgesetzt.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Papierlink: https://arxiv.org /pdf/2203.02155.pdf

Darüber hinaus gibt es viele Ähnlichkeiten zwischen InstructGPT und ChatGPT. Daher ist ein gründliches Verständnis des InstructGPT-Papiers von großem Nutzen für Studenten, die etwas in Richtung ChatGPT arbeiten möchten. Aus diesem Grund können wir die Vorträge von Li Mu wärmstens empfehlen.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Kursadresse: https://jmq.xet .tech/s/2lec6b (Klicken Sie auf „Originaltext lesen“, um direkt zu gelangen)

Dr. Li Mu ist der leitende Chefwissenschaftler von Amazon. Er hat zuvor mit Aston Zhang usw. zusammengearbeitet. Er ist Co-Autor von „Hands-On Deep Learning“. In den letzten zwei Jahren hat er durch Videos verschiedene KI-Kenntnisse an alle weitergegeben und intensive Lesekurse für Dutzende von Aufsätzen erstellt. Viele Studenten haben die Gewohnheit entwickelt, Li Mu beim intensiven Lesen von Aufsätzen zu folgen.

Dr. Li Mus Konto an Station B lautet „Lernen Sie KI von Li Mu“.

Dieser Interpretationskurs für InstructGPT dauert insgesamt 67 Minuten und wird grundsätzlich in der Reihenfolge des Verfassens der Arbeit eingeleitet.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Studenten, die den ChatGPT-Blog gelesen haben, wissen, dass seine technischen Prinzipien grundlegend sind Es kann mit einem Bild zusammengefasst werden, bei dem es sich auch um ein Bild handelt, das im InstructGPT-Papier erschienen ist (es gibt subtile Unterschiede zwischen den beiden). Bei der Interpretation der Zusammenfassung und der Einleitung des Papiers stellte Li Mu die drei Schritte im Diagramm ausführlich vor.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Technisches Schema aus dem ChatGPT-Blog.

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

Technisches Schema aus dem InstructGPT-Papier.

Im dritten Kapitel des Papiers stellte der Autor von InstructGPT zunächst seine Datenerfassungsmethode und -prozess vor, und Li Mu nahm auch alle mit, um es zu lesen einmal ausführlich. Dieser Teil ist im Ingenieurwesen sehr wertvoll. Wie Li Mu sagte: Wenn Sie so etwas noch nie gemacht haben (Datenkennzeichnung usw.) und jemanden finden müssen, der Ihnen bei der Datenkennzeichnung hilft, können Sie sich den Anhang ansehen, der viele Vorlagen enthält, die direkt verwendet werden können. Der Autor des Artikels beschreibt sogar, wie die Benutzeroberfläche seiner kommentierten Website aussieht, von der es sich zu lernen lohnt.

Als nächstes konzentrierte sich Li Mu auf die drei in Kapitel 3 beschriebenen Modelle (siehe 3.5 Modelle) – SFT-Modell (Supervised Fine-Tuning), RM-Modell (Reward Modeling) und RL-Modelle (Reinforcement Learning). einschließlich Details wie Parameter und Zielfunktionen, die an diesen Modellen beteiligt sind.

Abschließend kam Li Mu zu dem Schluss, dass InstructGPT technisch gesehen immer noch eine sehr praktische Technologie ist. Es erklärt jedem eine Methode: Wie kann man angesichts eines großen Sprachmodells seine Leistung in einem Bereich, der einem am Herzen liegt, durch einige annotierte Daten schnell verbessern, um es praktisch zu machen? Daher bietet es eine praktische Idee für Menschen, die generative Modelle zur Herstellung von Produkten verwenden möchten.

Natürlich erfolgt die wissenschaftliche Forschungsarbeit, wie Dr. Li Mu sagte, Schritt für Schritt, und InstructGPT basiert auch auf früheren Forschungen, also auf Studenten, die dies möchten Ich verstehe voll und ganz, dass ChatGPT unweigerlich zurückgehen wird, um weitere Artikel zu lesen. In früheren Kursen hat Li Mu auch die Papiere von GPT, GPT-2 und GPT-3 ausführlich interpretiert:

Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen

#🎜 🎜#

Kursadresse: https://jmq.xet.tech/s/2lec6b

Das obige ist der detaillierte Inhalt vonLernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Mit ChatGPT können kostenlose Benutzer jetzt Bilder mithilfe von DALL-E 3 mit einem Tageslimit generieren Mit ChatGPT können kostenlose Benutzer jetzt Bilder mithilfe von DALL-E 3 mit einem Tageslimit generieren Aug 09, 2024 pm 09:37 PM

DALL-E 3 wurde im September 2023 offiziell als deutlich verbessertes Modell gegenüber seinem Vorgänger eingeführt. Er gilt als einer der bisher besten KI-Bildgeneratoren und ist in der Lage, Bilder mit komplexen Details zu erstellen. Zum Start war es jedoch exklusiv

Das Stable Diffusion 3-Papier wird endlich veröffentlicht und die architektonischen Details werden enthüllt. Wird es helfen, Sora zu reproduzieren? Das Stable Diffusion 3-Papier wird endlich veröffentlicht und die architektonischen Details werden enthüllt. Wird es helfen, Sora zu reproduzieren? Mar 06, 2024 pm 05:34 PM

Der Artikel von StableDiffusion3 ist endlich da! Dieses Modell wurde vor zwei Wochen veröffentlicht und verwendet die gleiche DiT-Architektur (DiffusionTransformer) wie Sora. Nach seiner Veröffentlichung sorgte es für großes Aufsehen. Im Vergleich zur Vorgängerversion wurde die Qualität der von StableDiffusion3 generierten Bilder erheblich verbessert. Es unterstützt jetzt Eingabeaufforderungen mit mehreren Themen, und der Textschreibeffekt wurde ebenfalls verbessert, und es werden keine verstümmelten Zeichen mehr angezeigt. StabilityAI wies darauf hin, dass es sich bei StableDiffusion3 um eine Reihe von Modellen mit Parametergrößen von 800 M bis 8 B handelt. Durch diesen Parameterbereich kann das Modell direkt auf vielen tragbaren Geräten ausgeführt werden, wodurch der Einsatz von KI deutlich reduziert wird

Die perfekte Kombination aus ChatGPT und Python: Erstellen eines intelligenten Kundenservice-Chatbots Die perfekte Kombination aus ChatGPT und Python: Erstellen eines intelligenten Kundenservice-Chatbots Oct 27, 2023 pm 06:00 PM

Die perfekte Kombination aus ChatGPT und Python: Erstellen eines intelligenten Kundenservice-Chatbots Einführung: Im heutigen Informationszeitalter sind intelligente Kundenservicesysteme zu einem wichtigen Kommunikationsinstrument zwischen Unternehmen und Kunden geworden. Um den Kundenservice zu verbessern, greifen viele Unternehmen auf Chatbots zurück, um Aufgaben wie Kundenberatung und Beantwortung von Fragen zu erledigen. In diesem Artikel stellen wir vor, wie Sie mithilfe des leistungsstarken ChatGPT-Modells und der Python-Sprache von OpenAI einen intelligenten Kundenservice-Chatbot erstellen und verbessern können

So installieren Sie ChatGPT auf einem Mobiltelefon So installieren Sie ChatGPT auf einem Mobiltelefon Mar 05, 2024 pm 02:31 PM

Installationsschritte: 1. Laden Sie die ChatGTP-Software von der offiziellen ChatGTP-Website oder dem mobilen Store herunter. 2. Wählen Sie nach dem Öffnen in der Einstellungsoberfläche die Sprache aus. 3. Wählen Sie in der Spieloberfläche das Mensch-Maschine-Spiel aus 4. Geben Sie nach dem Start Befehle in das Chatfenster ein, um mit der Software zu interagieren.

So entwickeln Sie einen intelligenten Chatbot mit ChatGPT und Java So entwickeln Sie einen intelligenten Chatbot mit ChatGPT und Java Oct 28, 2023 am 08:54 AM

In diesem Artikel stellen wir vor, wie man intelligente Chatbots mit ChatGPT und Java entwickelt, und stellen einige spezifische Codebeispiele bereit. ChatGPT ist die neueste Version des von OpenAI entwickelten Generative Pre-Training Transformer, einer auf neuronalen Netzwerken basierenden Technologie für künstliche Intelligenz, die natürliche Sprache verstehen und menschenähnlichen Text generieren kann. Mit ChatGPT können wir ganz einfach adaptive Chats erstellen

NeRF und die Vergangenheit und Gegenwart des autonomen Fahrens, eine Zusammenfassung von fast 10 Artikeln! NeRF und die Vergangenheit und Gegenwart des autonomen Fahrens, eine Zusammenfassung von fast 10 Artikeln! Nov 14, 2023 pm 03:09 PM

Seit Neural Radiance Fields im Jahr 2020 vorgeschlagen wurde, hat die Zahl verwandter Arbeiten exponentiell zugenommen. Es hat sich nicht nur zu einem wichtigen Zweig der dreidimensionalen Rekonstruktion entwickelt, sondern ist auch allmählich an der Forschungsgrenze als wichtiges Werkzeug für autonomes Fahren aktiv geworden . NeRF ist in den letzten zwei Jahren plötzlich aufgetaucht, hauptsächlich weil es die Merkmalspunktextraktion und -anpassung, die epipolare Geometrie und Triangulation, PnP plus Bündelanpassung und andere Schritte der traditionellen CV-Rekonstruktionspipeline und sogar die Netzrekonstruktion, Kartierung und Lichtverfolgung überspringt , direkt aus 2D Das Eingabebild wird verwendet, um ein Strahlungsfeld zu lernen, und dann wird aus dem Strahlungsfeld ein gerendertes Bild ausgegeben, das einem echten Foto nahekommt. Mit anderen Worten: Lassen Sie ein implizites dreidimensionales Modell, das auf einem neuronalen Netzwerk basiert, zur angegebenen Perspektive passen

Das chinesische Team gewann die Auszeichnungen „Best Paper' und „Best System Paper' und die CoRL-Forschungsergebnisse wurden bekannt gegeben. Das chinesische Team gewann die Auszeichnungen „Best Paper' und „Best System Paper' und die CoRL-Forschungsergebnisse wurden bekannt gegeben. Nov 10, 2023 pm 02:21 PM

Seit ihrer ersten Veranstaltung im Jahr 2017 hat sich die CoRL zu einer der weltweit führenden akademischen Konferenzen an der Schnittstelle von Robotik und maschinellem Lernen entwickelt. CoRL ist eine themenspezifische Konferenz für Roboterlernforschung, die mehrere Themen wie Robotik, maschinelles Lernen und Steuerung, einschließlich Theorie und Anwendung, abdeckt. Die CoRL-Konferenz 2023 findet vom 6. bis 9. November in Atlanta, USA, statt. Nach offiziellen Angaben wurden in diesem Jahr 199 Arbeiten aus 25 Ländern für CoRL ausgewählt. Beliebte Themen sind Operationen, Reinforcement Learning und mehr. Obwohl CoRL von kleinerem Umfang ist als große akademische KI-Konferenzen wie AAAI und CVPR, wird die Beliebtheit von Konzepten wie großen Modellen, verkörperter Intelligenz und humanoiden Robotern in diesem Jahr zunehmen, aber auch relevante Forschung verdient Aufmerksamkeit

Kann Chatgpt in China verwendet werden? Kann Chatgpt in China verwendet werden? Mar 05, 2024 pm 03:05 PM

chatgpt kann in China verwendet werden, kann jedoch nicht registriert werden. Wenn Benutzer sich registrieren möchten, können sie zur Registrierung eine ausländische Mobiltelefonnummer verwenden. Beachten Sie, dass während des Registrierungsprozesses auf die Netzwerkumgebung umgestellt werden muss eine fremde IP.

See all articles