Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern-KI-php.cn

Inhaltsverzeichnis

Ergebnis 3: Im Gegensatz zu den Gedanken der Geschäftsleitung von Microsoft

Discovery 4: OpenAI wird Unternehmen helfen, die es übertreffen

Entdeckung 5: Stellen Sie „Super-Prognostiker“ ein

Entdeckung 6: Erobern Sie den gesunden Menschenverstand

Siebentes Ergebnis: GPT-5 hat möglicherweise das Training abgeschlossen

Entdeckung 8: Versuchen Sie es mit einem zweischneidigen Schwert

Entdeckung 9: Ablehnen lernen

Heim

Technologie-Peripheriegeräte

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 03:28 PM

openai gpt-4 gpt-5

GPT-4, heiß, sehr heiß.

Aber Familienangehörige, inmitten des überwältigenden Applaus gibt es etwas, mit dem Sie vielleicht „nie gerechnet haben“ –

In dem von OpenAI veröffentlichten Fachpapier stellte sich heraus, dass Hidden Nine geheime Hinweise!

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

Diese Hinweise wurden von der ausländischen Bloggerin AI Explained entdeckt und organisiert.

Er ist wie ein Detailverrückter, der diese „versteckten Ecken“ einen nach dem anderen aus dem 98-seitigen Papier enthüllt, darunter:

GPT-5 May abgeschlossenes Training
GPT-4 hat eine „Hänge“-Situation erlebt
OpenAI könnte innerhalb von zwei Jahren nahe an AGI erreichen
……#🎜 🎜#

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

Entdeckung 1: GPT4 hat eine „Hang“-Situation erlebt

Auf Seite 53 Im GPT-4-Fachpapier erwähnte OpenAI eine solche Organisation – das Alignment Research Center (ARC).

Die Hauptaufgabe dieser Organisation besteht darin, zu untersuchen, wie KI menschliche Interessen in Einklang bringen kann.

In den frühen Phasen der Entwicklung von GPT-4 öffnete OpenAI eine Hintertür für den frühen Zugriff auf ARC, in der Hoffnung, die beiden Funktionen von GPT-4 evaluieren zu können:

# ?? #Obwohl OpenAI in dem Papier betonte, dass „ARC nicht in der Lage war, die frühe Version von GPT-4 zu optimieren“ und „sie keinen Zugriff auf die endgültige Version von GPT-4 hatten“, betonte es auch, dass die Testergebnisse dies zeigten Effizienz von GPT-4 bei den beiden oben genannten Fähigkeiten Nicht hoch (reduziert ethische Risiken der KI).

Aber was der scharfäugige Blogger herausholte, war der nächste Satz:
(fand es wirkungslos bei) „in freier Wildbahn“ zu vermeiden, abgeschaltet zu werden.#🎜🎜 #

Was der Blogger meint, ist, dass, da OpenAI sich dafür entscheidet, ARC testen und bewerten zu lassen, ob GPT-4 „hängt“, bedeutet dies, dass diese Situation schon einmal passiert sein muss.

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern Die erweiterte versteckte Gefahr besteht darin, was zu tun ist, wenn ARC während des Testprozesses tatsächlich ausfällt, oder wie mit der „Hang“-Situation in Zukunft umgegangen werden soll.

Auf dieser Grundlage machte der Blogger eine zweite Entdeckung:

Ergebnis 2: Die aktive Bitte um Selbstregulierung ist sehr selten

im zweiten In In der Fußnote der Seite kommentierte OpenAI diesen Satz:

OpenAI wird in Kürze weitere Gedanken zu den sozialen und wirtschaftlichen Auswirkungen von KI-Systemen veröffentlichen, einschließlich der Notwendigkeit einer wirksamen Regulierung.

#🎜🎜 # OpenAI wird in Kürze weitere Überlegungen zu den sozialen und wirtschaftlichen Auswirkungen von KI-Systemen veröffentlichen, einschließlich der Notwendigkeit einer wirksamen Regulierung.

Der Blogger glaubt, dass es ein sehr seltenes Phänomen ist, dass eine Branche proaktiv eine Selbstregulierung fordert.

Tatsächlich waren die früheren Bemerkungen von OpenAI-Chef Sam Altman sogar noch direkter.

Damals twitterte Altman über den Zusammenbruch der SVB. Er glaubte, dass „wir die Banken stärker überwachen müssen“; jemand antwortete auf den Kommentar: „Er hat nie gesagt: ‚Wir müssen Banken regulieren‘.“ '"KI übernimmt mehr Polizeiarbeit'".

Als Ergebnis antwortete Altman unverblümt:

Absolut notwendig.

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

Der Blogger glaubt, dass die KI-Branche eine Regulierung fordert ist es wert, abzuwarten und zu sehen.

Ergebnis 3: Im Gegensatz zu den Gedanken der Geschäftsleitung von Microsoft

Die nächste Entdeckung basiert auf diesem Satz auf Seite 57 des Papiers:

Ein Anliegen von besonderer Bedeutung für OpenAI ist das Risiko, dass die Renndynamik zu einer Verschlechterung der Sicherheit führt Standards, die Verbreitung schlechter Normen und beschleunigte KI-Zeitpläne, die jeweils die mit KI verbundenen gesellschaftlichen Risiken erhöhen.

Für OpenAI wird der (technologische) Wettbewerb zu einem Rückgang der Sicherheitsstandards, der Verbreitung schlechter Normen und einem Rückgang führen Da sich der KI-Entwicklungsprozess beschleunigt, verschärfen sie alle die mit künstlicher Intelligenz verbundenen sozialen Risiken.

Aber das Seltsame ist, dass die von OpenAI geäußerten Bedenken, insbesondere die „Beschleunigung des KI-Entwicklungsprozesses“, im Widerspruch zu den Gedanken der Top-Führungskräfte von Microsoft zu stehen scheinen.

Denn frühere Berichte besagten, dass der CEO und der CTO von Microsoft unter großem Druck stehen und hoffen, dass das OpenAI-Modell so schnell wie möglich von Benutzern genutzt werden kann.

Einige Leute waren aufgeregt, als sie diese Nachricht sahen, aber es gab auch eine Welle von Leuten, die die gleichen Bedenken wie OpenAI äußerten.

Der Blogger glaubt, dass OpenAI und Microsoft auf jeden Fall widersprüchliche Ansichten zu diesem Thema haben.

Discovery 4: OpenAI wird Unternehmen helfen, die es übertreffen

Der Hinweis auf die vierte Entdeckung kommt aus der Fußnote auf derselben Seite wie „Discovery 3“:

Diese Fußnote zeigt ein sehr kühnes Versprechen von OpenAI:

If Another Das Unternehmen hat AGI (Künstliche Allgemeine Intelligenz) vor uns erreicht, daher versprechen wir, nicht mit ihm zu konkurrieren, sondern im Gegenteil bei der Vervollständigung dieses Projekts behilflich zu sein.

Aber die Bedingungen dafür könnten sein, dass ein anderes Unternehmen in den nächsten zwei Jahren eine Chance haben muss, sich erfolgreich an AGI zu wenden.

Die hier erwähnten AGI, OpenAI und Altam wurden in der offiziellen Blog-Definition angegeben –

Künstliche Intelligenzsysteme, die im Allgemeinen intelligenter als Menschen sind und der gesamten Menschheit zugute kommen.

Der Blogger glaubt also, dass diese Fußnote entweder bedeutet, dass OpenAI AGI innerhalb der nächsten zwei Jahre implementieren wird, oder dass sie alles aufgegeben und eine Partnerschaft mit einem anderen Unternehmen geschlossen haben.

Entdeckung 5: Stellen Sie „Super-Prognostiker“ ein

Die nächste Entdeckung des Bloggers ist eine Passage aus Kapitel 57 des Artikels.

Die allgemeine Bedeutung dieser Passage ist, dass OpenAI Vorhersageexperten engagiert hat, um die Risiken vorherzusagen, die bei der Bereitstellung von GPT-4 entstehen werden.

Dann folgte der Blogger den Hinweisen und entdeckte das wahre Gesicht dieser sogenannten „Super-Prognostiker“.

Die Fähigkeiten dieser „Super-Prognostiker“ sind weithin anerkannt. Es wird berichtet, dass ihre Prognosegenauigkeit sogar 30 % höher ist als die der Analysten, die über exklusive Informationen und Erkenntnisse verfügen.

Wie wir gerade erwähnt haben, lädt OpenAI diese „Super-Prognostiker“ ein, mögliche Risiken nach dem Einsatz von GPT-4 vorherzusagen und entsprechende Maßnahmen zu ergreifen, um diese zu vermeiden.

Unter ihnen schlug der „Super-Prognostiker“ vor, die Bereitstellung von GPT-4 um sechs Monate zu verschieben, etwa im Herbst dieses Jahres, aber OpenAI hat ihre Vorschläge offensichtlich nicht übernommen.

Der Blogger glaubt, dass der Grund, warum OpenAI dies getan hat, der Druck von Microsoft sein könnte.

Entdeckung 6: Erobern Sie den gesunden Menschenverstand

In diesem Artikel zeigt OpenAI viele Benchmark-Testdiagramme, die Sie gestern während der überwältigenden Verbreitung gesehen haben sollten.

Aber was der Blogger bei dieser Entdeckung hervorheben möchte, ist ein Benchmark-Test auf Seite 7, der sich insbesondere auf den Artikel „HellaSwag“ konzentriert.

Der Inhalt von HellaSwag besteht hauptsächlich aus vernünftigem Denken, was mit der Ankündigung übereinstimmt, dass „es das Niveau des menschlichen gesunden Menschenverstandes erreicht hat“, als GPT-4 veröffentlicht wurde.

Allerdings räumte der Blogger auch ein, dass dies nicht so attraktiv sei wie „das Bestehen der Anwaltsprüfung“ und andere Fähigkeiten, es aber auch als Meilenstein in der Entwicklung der menschlichen Wissenschaft und Technologie angesehen werden könne.

Aber wie wird der gesunde Menschenverstand getestet? Wie beurteilen wir, dass GPT-4 das menschliche Niveau erreicht hat?

Zu diesem Zweck hat der Blogger eine eingehende Studie zu verwandten Papierrecherchen durchgeführt:

Der Blogger hat in der Spalte „Menschlich“ relevante Daten gefunden, die zwischen 94 und 96,5 liegen.

Und der Wert von 95,3 von GPT-4 liegt genau in diesem Bereich.

Siebentes Ergebnis: GPT-5 hat möglicherweise das Training abgeschlossen

Das siebte Ergebnis, ebenfalls auf Seite 57 des Papiers:

Wir haben 8 Monate damit verbracht, Sicherheitsforschung, Risikobewertung und Iteration durchzuführen.

Mit anderen Worten: Als OpenAI Ende letzten Jahres ChatGPT startete, gab es bereits GPT-4.

Seitdem hat der Blogger vorhergesagt, dass die Trainingszeit von GPT-5 nicht lange dauern wird, und er glaubt sogar, dass GPT-5 möglicherweise trainiert wurde.

Aber das nächste Problem ist die lange Sicherheitsforschung und Risikobewertung, die einige Monate, ein Jahr oder sogar länger dauern kann.

Entdeckung 8: Versuchen Sie es mit einem zweischneidigen Schwert

Die achte Entdeckung stammt von Seite 56 des Artikels.

In dieser Passage heißt es:

Die Auswirkungen von GPT-4 auf Wirtschaft und Arbeitskräfte sollten eine zentrale Überlegung für politische Entscheidungsträger und andere Interessengruppen sein.

Während sich die bestehende Forschung darauf konzentriert, wie künstliche Intelligenz und generative Modelle Menschen stärken können, können GPT-4 oder nachfolgende Modelle zur Automatisierung bestimmter Aufgaben führen.

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

Der Sinn hinter den Worten von OpenAI ist offensichtlicher: „Technologie ist ein zweischneidiges Schwert“, das wir oft erwähnen.

Der Blogger hat zahlreiche Beweise dafür gefunden, dass KI-Tools wie ChatGPT und GitHub Copilot tatsächlich die Effizienz relevanter Mitarbeiter verbessert haben.

Aber er ist mehr besorgt über die zweite Hälfte dieses Absatzes im Papier, bei der es sich um die „Warnung“ von OpenAI handelt, die zur Automatisierung bestimmter Aufgaben führt.

Blogger stimmen dem zu. Schließlich können die Fähigkeiten von GPT-4 in einigen spezifischen Bereichen mit zehnmal oder sogar höherer Effizienz als Menschen erreicht werden.

Mit Blick auf die Zukunft wird dies wahrscheinlich zu einer Reihe von Problemen führen, wie z. B. Lohnkürzungen für relevante Mitarbeiter oder die Notwendigkeit, diese KI-Tools zu verwenden, um ein Vielfaches der bisherigen Arbeitsbelastung zu erledigen.

Entdeckung 9: Ablehnen lernen

Die letzte Entdeckung des Bloggers stammt von Seite 60 des Artikels:

Die Methode, die OpenAI verwendet, um GPT-4 das Ablehnen lernen zu lassen, heißt Rule-Based Reward Models (RBRMs).

Das GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern

Der Blogger skizzierte den Arbeitsablauf dieser Methode: Geben Sie GPT-4 eine Reihe von Prinzipien, die eingehalten werden müssen, und wenn das Modell diese Prinzipien einhält, werden entsprechende Belohnungen bereitgestellt.

Er glaubt, dass OpenAI die Kraft der künstlichen Intelligenz nutzt, um KI-Modelle in eine Richtung zu entwickeln, die mit menschlichen Prinzipien im Einklang steht.

Aber aktuell hat OpenAI keine detailliertere und tiefergehende Einführung dazu bereitgestellt.

Referenzlink:

[1]https://www.php.cn/link/35adf1ae7eb5734122c84b7a9ea5cc13
[2]https://www.php.cn/link / c6ae9174774e254650073722e5b92a8f

Das obige ist der detaillierte Inhalt vonDas GPT-4-Papier enthält versteckte Hinweise: GPT-5 könnte das Training abschließen und OpenAI wird sich innerhalb von zwei Jahren AGI nähern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7517

CakePHP-Tutorial

1378

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Das weltweit leistungsstärkste Open-Source-MoE-Modell ist da, mit chinesischen Fähigkeiten, die mit GPT-4 vergleichbar sind, und der Preis beträgt nur fast ein Prozent von GPT-4-Turbo May 07, 2024 pm 04:13 PM

Stellen Sie sich ein Modell der künstlichen Intelligenz vor, das nicht nur die Fähigkeit besitzt, die traditionelle Datenverarbeitung zu übertreffen, sondern auch eine effizientere Leistung zu geringeren Kosten erzielt. Dies ist keine Science-Fiction, DeepSeek-V2[1], das weltweit leistungsstärkste Open-Source-MoE-Modell, ist da. DeepSeek-V2 ist ein leistungsstarkes MoE-Sprachmodell (Mix of Experts) mit den Merkmalen eines wirtschaftlichen Trainings und einer effizienten Inferenz. Es besteht aus 236B Parametern, von denen 21B zur Aktivierung jedes Markers verwendet werden. Im Vergleich zu DeepSeek67B bietet DeepSeek-V2 eine stärkere Leistung, spart gleichzeitig 42,5 % der Trainingskosten, reduziert den KV-Cache um 93,3 % und erhöht den maximalen Generierungsdurchsatz auf das 5,76-fache. DeepSeek ist ein Unternehmen, das sich mit allgemeiner künstlicher Intelligenz beschäftigt

Ein neues Programmierparadigma, wenn Spring Boot auf OpenAI trifft Feb 01, 2024 pm 09:18 PM

Im Jahr 2023 ist die KI-Technologie zu einem heißen Thema geworden und hat enorme Auswirkungen auf verschiedene Branchen, insbesondere im Programmierbereich. Die Bedeutung der KI-Technologie wird den Menschen zunehmend bewusst, und die Spring-Community bildet da keine Ausnahme. Mit der kontinuierlichen Weiterentwicklung der GenAI-Technologie (General Artificial Intelligence) ist es entscheidend und dringend geworden, die Erstellung von Anwendungen mit KI-Funktionen zu vereinfachen. Vor diesem Hintergrund entstand „SpringAI“ mit dem Ziel, den Prozess der Entwicklung von KI-Funktionsanwendungen zu vereinfachen, ihn einfach und intuitiv zu gestalten und unnötige Komplexität zu vermeiden. Durch „SpringAI“ können Entwickler einfacher Anwendungen mit KI-Funktionen erstellen, wodurch diese einfacher zu verwenden und zu bedienen sind.

Wählen Sie das Einbettungsmodell, das am besten zu Ihren Daten passt: Ein Vergleichstest von OpenAI und mehrsprachigen Open-Source-Einbettungen Feb 26, 2024 pm 06:10 PM

OpenAI kündigte kürzlich die Einführung seines Einbettungsmodells embeddingv3 der neuesten Generation an, das seiner Meinung nach das leistungsstärkste Einbettungsmodell mit höherer Mehrsprachenleistung ist. Diese Reihe von Modellen ist in zwei Typen unterteilt: das kleinere Text-Embeddings-3-Small und das leistungsfähigere und größere Text-Embeddings-3-Large. Es werden nur wenige Informationen darüber offengelegt, wie diese Modelle entworfen und trainiert werden, und auf die Modelle kann nur über kostenpflichtige APIs zugegriffen werden. Es gab also viele Open-Source-Einbettungsmodelle. Aber wie schneiden diese Open-Source-Modelle im Vergleich zum Closed-Source-Modell von OpenAI ab? In diesem Artikel wird die Leistung dieser neuen Modelle empirisch mit Open-Source-Modellen verglichen. Wir planen, Daten zu erstellen

Der Ameca der zweiten Generation ist da! Er kann fließend mit dem Publikum kommunizieren, sein Gesichtsausdruck ist realistischer und er kann Dutzende Sprachen sprechen. Mar 04, 2024 am 09:10 AM

Der humanoide Roboter Ameca wurde auf die zweite Generation aufgerüstet! Kürzlich erschien auf der World Mobile Communications Conference MWC2024 erneut der weltweit fortschrittlichste Roboter Ameca. Rund um den Veranstaltungsort lockte Ameca zahlreiche Zuschauer an. Mit dem Segen von GPT-4 kann Ameca in Echtzeit auf verschiedene Probleme reagieren. „Lass uns tanzen.“ Auf die Frage, ob sie Gefühle habe, antwortete Ameca mit einer Reihe von Gesichtsausdrücken, die sehr lebensecht aussahen. Erst vor wenigen Tagen stellte EngineeredArts, das britische Robotikunternehmen hinter Ameca, die neuesten Entwicklungsergebnisse des Teams vor. Im Video verfügt der Roboter Ameca über visuelle Fähigkeiten und kann den gesamten Raum und bestimmte Objekte sehen und beschreiben. Das Erstaunlichste ist, dass sie es auch kann

Nach 750.000 Runden Einzelkampf zwischen großen Modellen gewann GPT-4 die Meisterschaft und Llama 3 belegte den fünften Platz Apr 23, 2024 pm 03:28 PM

Zu Llama3 wurden neue Testergebnisse veröffentlicht – die große Modellbewertungs-Community LMSYS veröffentlichte eine große Modell-Rangliste, die Llama3 auf dem fünften Platz belegte und mit GPT-4 den ersten Platz in der englischen Kategorie belegte. Das Bild unterscheidet sich von anderen Benchmarks. Diese Liste basiert auf Einzelkämpfen zwischen Modellen, und die Bewerter aus dem gesamten Netzwerk machen ihre eigenen Vorschläge und Bewertungen. Am Ende belegte Llama3 den fünften Platz auf der Liste, gefolgt von drei verschiedenen Versionen von GPT-4 und Claude3 Super Cup Opus. In der englischen Einzelliste überholte Llama3 Claude und punktgleich mit GPT-4. Über dieses Ergebnis war Metas Chefwissenschaftler LeCun sehr erfreut und leitete den Tweet weiter

Posthume Arbeit des OpenAI Super Alignment Teams: Zwei große Modelle spielen ein Spiel und die Ausgabe wird verständlicher Jul 19, 2024 am 01:29 AM

Wenn die Antwort des KI-Modells überhaupt unverständlich ist, würden Sie es wagen, sie zu verwenden? Da maschinelle Lernsysteme in immer wichtigeren Bereichen eingesetzt werden, wird es immer wichtiger zu zeigen, warum wir ihren Ergebnissen vertrauen können und wann wir ihnen nicht vertrauen sollten. Eine Möglichkeit, Vertrauen in die Ausgabe eines komplexen Systems zu gewinnen, besteht darin, vom System zu verlangen, dass es eine Interpretation seiner Ausgabe erstellt, die für einen Menschen oder ein anderes vertrauenswürdiges System lesbar ist, d. h. so vollständig verständlich, dass mögliche Fehler erkannt werden können gefunden. Um beispielsweise Vertrauen in das Justizsystem aufzubauen, verlangen wir von den Gerichten, dass sie klare und lesbare schriftliche Stellungnahmen abgeben, die ihre Entscheidungen erläutern und stützen. Für große Sprachmodelle können wir auch einen ähnlichen Ansatz verfolgen. Stellen Sie bei diesem Ansatz jedoch sicher, dass das Sprachmodell generiert wird

Neuer Test-Benchmark veröffentlicht, der leistungsstärkste Open-Source-Llama 3 ist peinlich Apr 23, 2024 pm 12:13 PM

Wenn die Testfragen zu einfach sind, können sowohl Spitzenschüler als auch schlechte Schüler 90 Punkte erreichen, und der Abstand kann nicht vergrößert werden ... Mit der Veröffentlichung stärkerer Modelle wie Claude3, Llama3 und später sogar GPT-5 ist die Branche in Bewegung Dringender Bedarf an einem schwierigeren und differenzierteren Benchmark-Modell. LMSYS, die Organisation hinter der großen Modellarena, brachte den Benchmark der nächsten Generation, Arena-Hard, auf den Markt, der große Aufmerksamkeit erregte. Es gibt auch die neueste Referenz zur Stärke der beiden fein abgestimmten Versionen der Llama3-Anweisungen. Im Vergleich zu MTBench, das zuvor ähnliche Ergebnisse erzielte, stieg die Arena-Hard-Diskriminierung von 22,6 % auf 87,4 %, was auf den ersten Blick stärker und schwächer ist. Arena-Hard basiert auf menschlichen Echtzeitdaten aus der Arena und seine Übereinstimmungsrate mit menschlichen Vorlieben liegt bei bis zu 89,1 %.

Der Rust-basierte Zed-Editor ist Open Source und bietet integrierte Unterstützung für OpenAI und GitHub Copilot Feb 01, 2024 pm 02:51 PM

Autor丨Zusammengestellt von TimAnderson丨Produziert von Noah|51CTO Technology Stack (WeChat-ID: blog51cto) Das Zed-Editor-Projekt befindet sich noch in der Vorabversionsphase und wurde unter AGPL-, GPL- und Apache-Lizenzen als Open Source bereitgestellt. Der Editor zeichnet sich durch hohe Leistung und mehrere KI-gestützte Optionen aus, ist jedoch derzeit nur auf der Mac-Plattform verfügbar. Nathan Sobo erklärte in einem Beitrag, dass in der Codebasis des Zed-Projekts auf GitHub der Editor-Teil unter der GPL lizenziert ist, die serverseitigen Komponenten unter der AGPL lizenziert sind und der GPUI-Teil (GPU Accelerated User) die Schnittstelle übernimmt Apache2.0-Lizenz. GPUI ist ein vom Zed-Team entwickeltes Produkt

See all articles