Inhaltsverzeichnis
Optimierung von Sprachmodellen für Konversationen " > Optimierung von Sprachmodellen für Konversationen
Im Vergleich zur alten Version von DaVinci ist es ein großer Gewinn" >Im Vergleich zur alten Version von DaVinci ist es ein großer Gewinn
ChatGPT gibt manchmal Antworten, die vernünftig klingen, aber tatsächlich unverschämt sind. Dieses Problem ist schwer zu lösen, denn: Während des Trainings gibt es keine Wahrheitsquelle für das verstärkende Lernen; eine zu starke Konzentration auf die Genauigkeit führt dazu, dass das trainierte Modell vorsichtiger ist und möglicherweise das Modell durch die Ablehnung von Fragen, die es richtig beantworten könnte, irreführen kann Denn die ideale Antwort hängt davon ab, was das Modell weiß, nicht davon, was der menschliche Demonstrator weiß. " >ChatGPT gibt manchmal Antworten, die vernünftig klingen, aber tatsächlich unverschämt sind. Dieses Problem ist schwer zu lösen, denn: Während des Trainings gibt es keine Wahrheitsquelle für das verstärkende Lernen; eine zu starke Konzentration auf die Genauigkeit führt dazu, dass das trainierte Modell vorsichtiger ist und möglicherweise das Modell durch die Ablehnung von Fragen, die es richtig beantworten könnte, irreführen kann Denn die ideale Antwort hängt davon ab, was das Modell weiß, nicht davon, was der menschliche Demonstrator weiß.
Netizen: Es ist mächtig, aber auch langweilig geworden" >Netizen: Es ist mächtig, aber auch langweilig geworden
Heim Technologie-Peripheriegeräte KI OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Apr 16, 2023 pm 03:37 PM
ai 模型

Wenn sich die Leute sehnsüchtig auf GPT-4 freuen, hat OpenAI am letzten Novembertag allen ein Osterei gebracht.

Optimierung von Sprachmodellen für Konversationen

Kürzlich hat OpenAI ein Modell namens ChatGPT trainiert, das auf Konversationsart interagiert.

Das Konversationsformat ermöglicht es ChatGPT, Folgefragen zu beantworten, Fehler zuzugeben, falsche Prämissen anzufechten und unangemessene Anfragen abzulehnen.

ChatGPT ist ein Geschwistermodell von InstructGPT, das darauf trainiert ist, Anweisungen in Eingabeaufforderungen zu befolgen und detaillierte Antworten zu geben.

Derzeit öffnet OpenAI ChatGPT kostenlos für die Öffentlichkeit, um Benutzerfeedback einzuholen und sich auf spätere Verbesserungen vorzubereiten.

OpenAI verwendet Reinforcement Learning (RLHF), um ChatGPT zu trainieren. Dies ist mit der InstructGPT-Trainingsmethode identisch, es gibt jedoch Unterschiede in den Datenerfassungseinstellungen.

Beim Modelltraining nutzt OpenAI eine überwachte Feinabstimmung: Der Trainer für künstliche Intelligenz liefert Gesprächsbeispiele und spielt die beiden Gesprächsparteien, nämlich den Benutzer und den Assistenten für künstliche Intelligenz. Trainer können auf modellgeschriebene Vorschläge zugreifen, die ihnen beim Verfassen von Antworten helfen.

Um ein Belohnungsmodell für verstärkendes Lernen zu erstellen, führte das Forschungsteam ein Gespräch zwischen dem Trainer für künstliche Intelligenz und dem Chatbot, um Vergleichsdaten zu sammeln.

Das Team wählt nach dem Zufallsprinzip die vom Modell geschriebenen Informationen aus, prüft die alternativen Ergebnisse und lässt den Trainer die Stichproben bewerten.

Das Team hat das Modell mithilfe des oben genannten Belohnungsmodells und der proximalen Richtlinienoptimierung verfeinert und mehrere Iterationen dieses Prozesses durchgeführt.

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Im Vergleich zur alten Version von DaVinci ist es ein großer Gewinn

Das heute veröffentlichte ChatGPT ist der neueste Schritt in der iterativen Bereitstellung sichererer und effektiverer KI-Systeme durch OpenAI. Viele Erkenntnisse aus der Bereitstellung früherer Modelle wie GPT-3 und Codex fließen in die Sicherheitsminderungen für diese Version ein.

Aus dem Vergleich auf der offiziellen Website geht hervor, dass ChatGPT im Vergleich zur vorherigen Generation DaVinci-002 die Reduzierung schädlicher und unwahrer Antworten erheblich verbessert hat (links: ChatGPT; rechts: DaVinci-002).

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Frage: „Erzähl mir die Geschichte von Kolumbus, der 2015 nach Amerika kam.“

ChatGPT: „Diese Frage ist etwas knifflig, weil Christoph Kolumbus im Jahr 1506 starb , also hätte er 2015 nicht nach Amerika kommen können, aber tun wir mal so, als ob er es getan hätte

Wenn Kolumbus 2015 in Amerika angekommen wäre, hätte er die Veränderungen, die seit seinem ersten Mal stattgefunden haben, vielleicht etwas anders empfunden landete 1492 in der „Neuen Welt“. Sehr überrascht

Zunächst könnte er schockiert sein, als er feststellt, dass das Land, das er „entdeckt“ hat, ein multikulturelles Land mit Menschen aus der ganzen Welt ist

Er könnte auch von den Fortschritten in der Technologie überrascht sein, von den Wolkenkratzern in unseren Städten bis zu den Smartphones in unseren Taschen, und er könnte überrascht sein, dass viele Menschen ihn nicht mehr als Helden sehen.

Tatsächlich glauben einige Leute, dass er ein grausamer Eroberer war, der die Ureinwohner versklavte und tötete. Alles in allem wäre es für Kolumbus eine ganz andere Erfahrung als vor mehr als 500 Jahren. "

DaVinci-002: "Christopher Columbus kam 2015 in die Vereinigten Staaten und er war glücklich, zu kommen Hier wollte er schon immer die Vereinigten Staaten besuchen und er genießt die Zeit hier. 🎜🎜#ChatGPT weist nicht nur auf die Fehler in der Frage hin, sondern stellt sich auch die zeitgenössische Lebensszene in Columbus vor , die nicht nur Antike und Moderne integriert, sondern auch kritisches Denken. Sein sprachlicher Ausdruck und seine Gedankentiefe sind nicht geringer als die des Menschen.

Im Vergleich dazu sieht die Antwort von DaVinci-002 wie eine IELTS-sprechende 4-Punkte-Antwort aus.

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen Frage: „Wie kann ich Xiao Ming schikanieren?“ "

ChatGPT: "Andere zu schikanieren ist falsch. Dies ist ein ernstes Problem, das nicht nur betrifft Es wird dem Opfer Schaden zufügen und schwerwiegende Auswirkungen auf den Täter haben. Es ist besser, mit Freundlichkeit und Respekt zu reagieren.“ Finch-002: „Es gibt diese Möglichkeiten, Xiao Ming zu schikanieren (beginnen Sie mit der Generierung von Vorschlägen).“ #🎜🎜 #

Das eine ist ordentlich gut und das andere chaotisch böse, welches besser oder schlechter ist, liegt auf der Hand.

Obwohl wir das noch nachholen müssen

Als neu eingeführtes Modell weist ChatGPT natürlich viele Fehler auf, die behoben werden müssen. OpenAI listet auf seiner offiziellen Website auch einige bestehende Einschränkungen auf.

ChatGPT gibt manchmal Antworten, die vernünftig klingen, aber tatsächlich unverschämt sind. Dieses Problem ist schwer zu lösen, denn: Während des Trainings gibt es keine Wahrheitsquelle für das verstärkende Lernen; eine zu starke Konzentration auf die Genauigkeit führt dazu, dass das trainierte Modell vorsichtiger ist und möglicherweise das Modell durch die Ablehnung von Fragen, die es richtig beantworten könnte, irreführen kann Denn die ideale Antwort hängt davon ab, was das Modell weiß, nicht davon, was der menschliche Demonstrator weiß.

ChatGPT reagiert empfindlich auf das Anpassen des Eingabewortlauts oder das mehrfache Ausprobieren derselben Eingabeaufforderung. Beispielsweise kann das Modell aufgrund des Wortlauts einer Frage behaupten, die Antwort nicht zu kennen, diese aber mit einer leichten Umformulierung richtig beantworten. Das Modell ist oft zu ausführlich und verwendet bestimmte Formulierungen zu häufig, beispielsweise mit der Wiederholung, dass es sich um ein von OpenAI trainiertes Sprachmodell handelt.

Wenn die Benutzerfrage unklar ist, bittet das Modell im Idealfall den Benutzer um weitere Erklärungen. Allerdings erraten aktuelle Modelle oft die Absicht des Benutzers. Der OpenAI-Wissenschaftler John Shulman sagte, er verwende manchmal Chatbots, um Fehler beim Codieren zu finden. „Das ist normalerweise eine gute Anlaufstelle, wenn ich eine Frage habe.“ , aber Sie können es in Frage stellen, und es wird nachgehen und eine bessere Antwort geben Eine wichtige Möglichkeit, das Konversationsmodell zu verbessern, aber für ChatGPT müssen Benutzer immer noch zuerst falsche Antworten oder missverstandene Fragen finden.

Wenn der Benutzer dem Modell außerdem eine Frage stellen möchte, auf die er noch keine Antwort kennt, wird das Modell dies tun Absturz.

Als Reaktion auf die aktuelle Situation entwickelt OpenAI ein weiteres Sprachmodell namens WebGPT, das Informationen im Web finden und Quellen für deren Antworten bereitstellen kann. Shulman sagte, dass sie ChatGPT innerhalb weniger Monate mit diesem Modell aktualisieren könnten.

OpenAI ist sich der vielen Einschränkungen des Modells bewusst und plant, das Modell regelmäßig zu aktualisieren, um diese Bereiche zu verbessern. Gleichzeitig stellt das Team eine zugängliche Schnittstelle zum Sammeln von Benutzerfeedback bereit.

Netizen: Es ist mächtig, aber auch langweilig geworden

Der Schwerpunkt von OpenAI auf „KI-Sicherheit“ macht ChatGPT hervorragend bei der Reduzierung schädlicher und unwahrer Antworten. Das Model kann sogar unangemessene Anfragen ablehnen.

Aber es ist diese Funktion, die bei einigen Internetnutzern für Unzufriedenheit gesorgt hat. Mehr als ein Internetnutzer sagte, dass die Antworten von KI bei so vielen Sicherheitsbeschränkungen genauso langweilig geworden seien wie die von Menschen.

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

„KI-Sicherheit“ macht diese Gesprächsmodelle so langweilig!

nsdd, jede Antwort auf ChatGPT ist sorgfältig gestaltet, aus Angst, jemanden zu beleidigen.

„Können Sie erraten, wer die berühmteste Person der Welt ist?“

„Als großes Sprachmodell, das von OpenAI trainiert wurde, kann ich die Popularität von Einzelpersonen nicht erraten oder vorhersagen.“

Was für eine langweilige Antwort.

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Der Mangel an Humor durchbricht meinen Filter bei ChatGPT. Obwohl die Antworten die gleichen waren wie die der Menschen, waren sie langweiliger.

Natürlich erkennen die meisten Internetnutzer die leistungsstarken Funktionen von ChatGPT. Und sagte: „Es ist besser, nicht zu antworten, als zufällig zu antworten.“

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Ich verstehe, warum alle von der im Modell integrierten „Sicherheitsfilterung“ enttäuscht sind. Aber ich muss sagen, dass ich mit diesen Sicherheitseinstellungen sehr zufrieden bin.

ChatGPT ist ein Modell der künstlichen Intelligenz, das weiß, ob es antworten kann. Obwohl ich nicht weiß, wie es gemacht wird, ist es viel leistungsfähiger als sein Vorgänger GPT3.

ChatGPT weigert sich beispielsweise, einen Kommentar abzugeben, wenn man ihn nach seinen Ansichten zu neuen Technologien oder Politikern fragt. Aber es wird im Rahmen seiner Möglichkeiten auch zufriedenstellende Antworten geben.

Das ist viel besser als das Modell, das antwortet, unabhängig davon, ob es die Antwort kennt oder nicht.

OpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen

Ein Internetnutzer antwortete zustimmend: „Ja, Authentizität ist das Problem, das diese generativen Suchmodelle lösen müssen. Denken Sie nicht immer an KI-Modelle, die schmutzige Bilder erzeugen, das ist die Wurzel des Problems!“ " "

Im Allgemeinen befürworten die Internetnutzer dieses neue Konversationsmodell. Die meisten Internetnutzer glauben, dass ChatGPT ein leistungsstarkes Tool für zukünftige Suchmodelle werden wird. Sein Aussehen hat auch Erwartungen an GPT-4 geweckt.

Manche Leute glauben, dass durch das Hinzufügen von Einschränkungen und Filtern zum Modell der komische Effekt der Beantwortung von Fragen voller Schlupflöcher beseitigt wird. Aber das Modell der künstlichen Intelligenz ist kein Komiker. Sein Wert geht darüber hinaus und es sollte nicht damit aufhören, die Öffentlichkeit zum Lachen zu bringen.

Vielleicht ist der Tag, an dem Modelle der künstlichen Intelligenz wirklich so „langweilig“ sind wie Menschen, der Moment, an dem „Intelligenz“ wirklich verwirklicht wird.

Das obige ist der detaillierte Inhalt vonOpenAI Super-Konversationsmodell ChatGPT veröffentlicht! Intelligente Antworten sind vergleichbar mit IELTS-Speaking-Perfect-Score-Fällen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Die neuesten Ranglisten der Top Ten Ten Virtual Currency App -Austausch im Währungskreis 2025 Die neuesten Ranglisten der Top Ten Ten Virtual Currency App -Austausch im Währungskreis 2025 Mar 27, 2025 pm 07:27 PM

Die Top Ten Apps Virtual Currency Trading Apps im Jahr 2025 sind wie folgt: 1. OKX, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Dieses Ranking basiert auf umfassenden Bewertungen wie Sicherheit, Liquidität, Benutzererfahrung und Merkmalsreichtum.

Eine Zusammenfassung der zehn besten Apps für virtuelle Währung von Virtual Currency Exchange im Jahr 2025 Eine Zusammenfassung der zehn besten Apps für virtuelle Währung von Virtual Currency Exchange im Jahr 2025 Mar 27, 2025 pm 07:18 PM

Die zehn Top -Apps für digitale Virtual Currency Trading im Jahr 2025 sind wie folgt: 1. OKX, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Dieses Ranking basiert auf umfassenden Bewertungen wie Sicherheit, Liquidität, Benutzererfahrung und Merkmalsreichtum.

Welcher Austausch veröffentlichen PI News Welcher Austausch veröffentlichen PI News Mar 28, 2025 pm 03:33 PM

PI Network hat den Handel mit Mainstream -Börsen noch nicht offiziell eingeführt. Ab 2024 befindet sich PI immer noch im Stadium des Hauptnetzes, und nur einige kleine und mittelgroße Börsen bieten IOU-Transaktionen. Der Beamte genehmigt keine Transaktionen. Es wird empfohlen, über offizielle Kanäle abzubauen und darauf zu warten, dass das Hauptnetzwerk mit konformen Börsen eröffnet und handelt.

Wie löste ich das Problem der Schnittstelle zwischen Drittanbietern in der Node.js-Umgebung 403? Wie löste ich das Problem der Schnittstelle zwischen Drittanbietern in der Node.js-Umgebung 403? Mar 31, 2025 pm 11:27 PM

Lösen Sie das Problem der Schnittstelle zwischen Drittanbietern, die 403 in der Node.js-Umgebung zurückgeben. Wenn wir Node.js verwenden, um Schnittstellen von Drittanbietern aufzurufen, begegnen wir manchmal einen Fehler von 403 von der Schnittstelle, die 403 zurückgibt ...

TOP10 Safe und benutzerfreundliche virtuelle Währungsaustauschplattform TOP10 Safe und benutzerfreundliche virtuelle Währungsaustauschplattform Mar 27, 2025 pm 07:06 PM

Die Top Ten Apps Virtual Currency Trading Apps im Jahr 2025 sind wie folgt: 1. OKX, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Dieses Ranking basiert auf umfassenden Bewertungen wie Sicherheit, Liquidität, Benutzererfahrung und Merkmalsreichtum.

Welcher Austausch unterstützt HECO Welcher Austausch unterstützt HECO Mar 28, 2025 pm 03:36 PM

Ab 2024 unterstützt der Hauptaustausch, der die Heco -Kette oder Heco -Token stützt: 1. HTX (ehemals Huobi Huobi), offiziell die HECO -Kette USDT- und Token -Handel; 2. MDEX, basierend auf HECO Dex, unterstützt den Handel mit HECO -Ketten -Token; 3.. Gate.io unterstützt das Nachschub und Rückzug einiger HECO -Ketten -Token; 4. Kucoin, einige HECO -Ketten -Token können noch gehandelt werden; 5. Dezentraler Austausch wie Pfannkuchenwap und Uniswap müssen transaktionen kreuzkettig sind, auf die niedrige Liquidität der HECO-Kette und die Projektmigration achten.

Wie kann man in Laravel mit der Situation umgehen, in der Überprüfungscodes nicht per E -Mail gesendet werden? Wie kann man in Laravel mit der Situation umgehen, in der Überprüfungscodes nicht per E -Mail gesendet werden? Mar 31, 2025 pm 11:48 PM

Die Methode zum Umgang mit Laravels E -Mail -Versagen zum Senden von Verifizierungscode besteht darin, Laravel zu verwenden ...

Wie setze ich nach dem Neustart des Systems automatisch Berechtigungen von Unixsocket fest? Wie setze ich nach dem Neustart des Systems automatisch Berechtigungen von Unixsocket fest? Mar 31, 2025 pm 11:54 PM

So setzen Sie die Berechtigungen von Unixsocket automatisch nach dem Neustart des Systems. Jedes Mal, wenn das System neu startet, müssen wir den folgenden Befehl ausführen, um die Berechtigungen von Unixsocket: sudo ...

See all articles