


Lernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen
Nachdem ChatGPT populär wurde, stellen viele Studenten, die sich mit Technologie beschäftigen, eine Frage: Gibt es Lernmaterialien, die es uns ermöglichen, die Prinzipien von ChatGPT systematisch zu verstehen? Dieses Problem wird schwierig, da OpenAI kein Papier zu ChatGPT veröffentlicht hat.
Aus dem Blog von OpenAI über ChatGPT wissen wir jedoch, dass die von ChatGPT verwendete Methode dieselbe ist wie ihr Brudermodell InstructGPT, mit der Ausnahme, dass InstructGPT in GPT-3 enthalten ist , während ChatGPT auf GPT-3.5 basiert. Auch hinsichtlich der Datenerhebung gibt es einige Unterschiede zwischen den beiden.
Blog-Link: https://openai.com /blog/chatgpt/
InstructGPTs Artikel wurde im März 2022 veröffentlicht, aber OpenAI veröffentlichte bereits im Januar einen entsprechenden Blog (siehe „GPT -3 What Was tun, wenn Sie Unsinn reden? OpenAI: Wir haben es neu trainiert und die neue Version ist „gehorsamer“). Damals erwähnte OpenAI deutlich, dass InstructGPT die Reinforcement-Learning-Methode des menschlichen Feedbacks (RLHF) verwendet, um GPT-3 zu verfeinern, wodurch die Ausgabe des Modells besser mit den menschlichen Vorlieben übereinstimmt. Dies wurde im Training von ChatGPT fortgesetzt.
Papierlink: https://arxiv.org /pdf/2203.02155.pdf
Darüber hinaus gibt es viele Ähnlichkeiten zwischen InstructGPT und ChatGPT. Daher ist ein gründliches Verständnis des InstructGPT-Papiers von großem Nutzen für Studenten, die etwas in Richtung ChatGPT arbeiten möchten. Aus diesem Grund können wir die Vorträge von Li Mu wärmstens empfehlen.
Kursadresse: https://jmq.xet .tech/s/2lec6b (Klicken Sie auf „Originaltext lesen“, um direkt zu gelangen)
Dr. Li Mu ist der leitende Chefwissenschaftler von Amazon. Er hat zuvor mit Aston Zhang usw. zusammengearbeitet. Er ist Co-Autor von „Hands-On Deep Learning“. In den letzten zwei Jahren hat er durch Videos verschiedene KI-Kenntnisse an alle weitergegeben und intensive Lesekurse für Dutzende von Aufsätzen erstellt. Viele Studenten haben die Gewohnheit entwickelt, Li Mu beim intensiven Lesen von Aufsätzen zu folgen.
Dr. Li Mus Konto an Station B lautet „Lernen Sie KI von Li Mu“.
Dieser Interpretationskurs für InstructGPT dauert insgesamt 67 Minuten und wird grundsätzlich in der Reihenfolge des Verfassens der Arbeit eingeleitet.
Studenten, die den ChatGPT-Blog gelesen haben, wissen, dass seine technischen Prinzipien grundlegend sind Es kann mit einem Bild zusammengefasst werden, bei dem es sich auch um ein Bild handelt, das im InstructGPT-Papier erschienen ist (es gibt subtile Unterschiede zwischen den beiden). Bei der Interpretation der Zusammenfassung und der Einleitung des Papiers stellte Li Mu die drei Schritte im Diagramm ausführlich vor.
Technisches Schema aus dem ChatGPT-Blog.
Technisches Schema aus dem InstructGPT-Papier.
Im dritten Kapitel des Papiers stellte der Autor von InstructGPT zunächst seine Datenerfassungsmethode und -prozess vor, und Li Mu nahm auch alle mit, um es zu lesen einmal ausführlich. Dieser Teil ist im Ingenieurwesen sehr wertvoll. Wie Li Mu sagte: Wenn Sie so etwas noch nie gemacht haben (Datenkennzeichnung usw.) und jemanden finden müssen, der Ihnen bei der Datenkennzeichnung hilft, können Sie sich den Anhang ansehen, der viele Vorlagen enthält, die direkt verwendet werden können. Der Autor des Artikels beschreibt sogar, wie die Benutzeroberfläche seiner kommentierten Website aussieht, von der es sich zu lernen lohnt.
Als nächstes konzentrierte sich Li Mu auf die drei in Kapitel 3 beschriebenen Modelle (siehe 3.5 Modelle) – SFT-Modell (Supervised Fine-Tuning), RM-Modell (Reward Modeling) und RL-Modelle (Reinforcement Learning). einschließlich Details wie Parameter und Zielfunktionen, die an diesen Modellen beteiligt sind.
Abschließend kam Li Mu zu dem Schluss, dass InstructGPT technisch gesehen immer noch eine sehr praktische Technologie ist. Es erklärt jedem eine Methode: Wie kann man angesichts eines großen Sprachmodells seine Leistung in einem Bereich, der einem am Herzen liegt, durch einige annotierte Daten schnell verbessern, um es praktisch zu machen? Daher bietet es eine praktische Idee für Menschen, die generative Modelle zur Herstellung von Produkten verwenden möchten.
Natürlich erfolgt die wissenschaftliche Forschungsarbeit, wie Dr. Li Mu sagte, Schritt für Schritt, und InstructGPT basiert auch auf früheren Forschungen, also auf Studenten, die dies möchten Ich verstehe voll und ganz, dass ChatGPT unweigerlich zurückgehen wird, um weitere Artikel zu lesen. In früheren Kursen hat Li Mu auch die Papiere von GPT, GPT-2 und GPT-3 ausführlich interpretiert:
Kursadresse: https://jmq.xet.tech/s/2lec6b
Das obige ist der detaillierte Inhalt vonLernen Sie schnell die wichtigsten technischen Punkte des InstructGPT-Papiers kennen: Folgen Sie Li Mu, um die Technologie hinter ChatGPT zu beherrschen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



DALL-E 3 wurde im September 2023 offiziell als deutlich verbessertes Modell gegenüber seinem Vorgänger eingeführt. Er gilt als einer der bisher besten KI-Bildgeneratoren und ist in der Lage, Bilder mit komplexen Details zu erstellen. Zum Start war es jedoch exklusiv

Der Artikel von StableDiffusion3 ist endlich da! Dieses Modell wurde vor zwei Wochen veröffentlicht und verwendet die gleiche DiT-Architektur (DiffusionTransformer) wie Sora. Nach seiner Veröffentlichung sorgte es für großes Aufsehen. Im Vergleich zur Vorgängerversion wurde die Qualität der von StableDiffusion3 generierten Bilder erheblich verbessert. Es unterstützt jetzt Eingabeaufforderungen mit mehreren Themen, und der Textschreibeffekt wurde ebenfalls verbessert, und es werden keine verstümmelten Zeichen mehr angezeigt. StabilityAI wies darauf hin, dass es sich bei StableDiffusion3 um eine Reihe von Modellen mit Parametergrößen von 800 M bis 8 B handelt. Durch diesen Parameterbereich kann das Modell direkt auf vielen tragbaren Geräten ausgeführt werden, wodurch der Einsatz von KI deutlich reduziert wird

Die perfekte Kombination aus ChatGPT und Python: Erstellen eines intelligenten Kundenservice-Chatbots Einführung: Im heutigen Informationszeitalter sind intelligente Kundenservicesysteme zu einem wichtigen Kommunikationsinstrument zwischen Unternehmen und Kunden geworden. Um den Kundenservice zu verbessern, greifen viele Unternehmen auf Chatbots zurück, um Aufgaben wie Kundenberatung und Beantwortung von Fragen zu erledigen. In diesem Artikel stellen wir vor, wie Sie mithilfe des leistungsstarken ChatGPT-Modells und der Python-Sprache von OpenAI einen intelligenten Kundenservice-Chatbot erstellen und verbessern können

Installationsschritte: 1. Laden Sie die ChatGTP-Software von der offiziellen ChatGTP-Website oder dem mobilen Store herunter. 2. Wählen Sie nach dem Öffnen in der Einstellungsoberfläche die Sprache aus. 3. Wählen Sie in der Spieloberfläche das Mensch-Maschine-Spiel aus 4. Geben Sie nach dem Start Befehle in das Chatfenster ein, um mit der Software zu interagieren.

In diesem Artikel stellen wir vor, wie man intelligente Chatbots mit ChatGPT und Java entwickelt, und stellen einige spezifische Codebeispiele bereit. ChatGPT ist die neueste Version des von OpenAI entwickelten Generative Pre-Training Transformer, einer auf neuronalen Netzwerken basierenden Technologie für künstliche Intelligenz, die natürliche Sprache verstehen und menschenähnlichen Text generieren kann. Mit ChatGPT können wir ganz einfach adaptive Chats erstellen

Seit Neural Radiance Fields im Jahr 2020 vorgeschlagen wurde, hat die Zahl verwandter Arbeiten exponentiell zugenommen. Es hat sich nicht nur zu einem wichtigen Zweig der dreidimensionalen Rekonstruktion entwickelt, sondern ist auch allmählich an der Forschungsgrenze als wichtiges Werkzeug für autonomes Fahren aktiv geworden . NeRF ist in den letzten zwei Jahren plötzlich aufgetaucht, hauptsächlich weil es die Merkmalspunktextraktion und -anpassung, die epipolare Geometrie und Triangulation, PnP plus Bündelanpassung und andere Schritte der traditionellen CV-Rekonstruktionspipeline und sogar die Netzrekonstruktion, Kartierung und Lichtverfolgung überspringt , direkt aus 2D Das Eingabebild wird verwendet, um ein Strahlungsfeld zu lernen, und dann wird aus dem Strahlungsfeld ein gerendertes Bild ausgegeben, das einem echten Foto nahekommt. Mit anderen Worten: Lassen Sie ein implizites dreidimensionales Modell, das auf einem neuronalen Netzwerk basiert, zur angegebenen Perspektive passen

Seit ihrer ersten Veranstaltung im Jahr 2017 hat sich die CoRL zu einer der weltweit führenden akademischen Konferenzen an der Schnittstelle von Robotik und maschinellem Lernen entwickelt. CoRL ist eine themenspezifische Konferenz für Roboterlernforschung, die mehrere Themen wie Robotik, maschinelles Lernen und Steuerung, einschließlich Theorie und Anwendung, abdeckt. Die CoRL-Konferenz 2023 findet vom 6. bis 9. November in Atlanta, USA, statt. Nach offiziellen Angaben wurden in diesem Jahr 199 Arbeiten aus 25 Ländern für CoRL ausgewählt. Beliebte Themen sind Operationen, Reinforcement Learning und mehr. Obwohl CoRL von kleinerem Umfang ist als große akademische KI-Konferenzen wie AAAI und CVPR, wird die Beliebtheit von Konzepten wie großen Modellen, verkörperter Intelligenz und humanoiden Robotern in diesem Jahr zunehmen, aber auch relevante Forschung verdient Aufmerksamkeit

chatgpt kann in China verwendet werden, kann jedoch nicht registriert werden. Wenn Benutzer sich registrieren möchten, können sie zur Registrierung eine ausländische Mobiltelefonnummer verwenden. Beachten Sie, dass während des Registrierungsprozesses auf die Netzwerkumgebung umgestellt werden muss eine fremde IP.
