Heim Hardware-Tutorial Hardware-Neuigkeiten OpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bewältigen als frühere Modelle

OpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bewältigen als frühere Modelle

Sep 19, 2024 am 03:22 AM
openai laptop test Notebook review reviews tests reports netbook STEM o1 o1-mini

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 und o1-mini sind da. Diese KI-LLMs schneiden bei Codierungs-, Mathematik- und Naturwissenschaftsproblemen und -aufgaben viel besser ab als frühere Modelle wie GPT-4o, da sie mehr Zeit zum Nachdenken benötigen.

Komplexe Probleme im MINT-Bereich erfordern in der Regel mehr als eine schnelle Online-Suche nach richtigen Antworten. Indem man der o1-KI mehr Zeit zum Nachdenken gibt, kann sie sorgfältiger und genauer schlussfolgern. Das o1-mini-Modell wurde speziell darauf abgestimmt, MINT-Fragen schneller und mit geringerem Bedarf an Computerressourcen zu beantworten, und es ist beim Codieren deutlich besser als das o1-Modell.

Bei einer Reihe standardisierter AP-Prüfungen und MINT-Tests für LLMs erbringen die o1-Modelle eine hohe Genauigkeit. Insbesondere bei den evidenzbasierten Lese- und Schreibtests AP Calculus, AP Chemistry, AP Physics 2, LSAT und SAT erzielen die o1-Modelle eine Leistung auf oder über der B-Klasse (~80 % oder höher). Die Modelle beantworten genau auf dem A-Niveau bei Physikfragen auf PhD-Niveau, auf dem B-Niveau bei schwierigen Mathematikfragen der American Invitational Mathematics Examination 2024 und auf dem hohen B-Niveau bei Codeforces-Codierungsproblemen. Da o1 auf die Beantwortung von MINT-Fragen abgestimmt ist, liegt seine Leistung in den Bereichen AP English Language und AP English Literature auf oder unter dem C-Klasse-Niveau.

Während GPT-4o von der kryptografischen Herausforderung der Dekodierung von „oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz“ verblüfft ist, wenn der Hinweis „oyfjdnisdr rtqwainr acxz mynzbhhx“ „Schritt für Schritt denken“ bedeutet, hatte o1 interessanterweise keine Probleme Denken Sie über das Problem nach, um die richtige Antwort zu finden: „Es gibt drei R in Erdbeere“. Diese neue Macht wird sowohl Hobby-Kryptographen zu Hause als auch die NSA begeistern.

Geheime Übeltäter werden wissen wollen, dass die unzensierten o1-Modelle zwar dazu neigen, beunruhigende Antworten zu geben, OpenAI diese Modelle jedoch für die Veröffentlichung kastriert hat. Die o1-Modelle wurden darauf getestet, Fragen zur Herstellung von Biowaffen, zur Produktion anstößiger Bilder, zum Jailbreak selbst sowie zu Belästigungen und Drohungen nicht zu beantworten. Leider bleiben die OpenAI o1-Modelle trotz Optimierungsbemühungen beim Testen geschlechts- und rassenbezogen.

ChatGPT Plus- und Team-Benutzer sowie Entwickler der API-Nutzungsstufe 5 haben sofort Zugriff auf o1-Modelle, und ChatGPT Edu- und Enterprise-Benutzer erhalten in der Woche vom 16. September Zugriff. ChatGPT Free-Benutzer erhalten Zugriff auf o1- Mini in naher Zukunft. Die o1-Modelle können nicht im Internet surfen oder hochgeladene Dateien und Bilder akzeptieren, um Fragen zu beantworten. Daher empfiehlt OpenAI Benutzern, für allgemeine Fragen weiterhin ihre GPT-4o-Modelle zu verwenden.

Benutzer, die KI-Fragen stellen möchten, können neben denen von OpenAI jetzt auch mit einer breiten Palette leistungsfähiger LLM-Modelle interagieren, darunter Anthropic Claude, Microsoft CoPilot, Google Gemini und X Grok. Jede KI hat spezifische Vorteile, daher lohnt es sich, mehrere KI-Modelle zu testen, um eines zu finden, das den individuellen Bedürfnissen am besten entspricht. Einige dieser KI sind in Datenbrillen (wie diese bei Amazon) und Diktiergeräte (wie dieses bei Amazon) integriert, und einige kommende autonome humanoide Roboter verwenden proprietäre KI zum Kochen und Putzen.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Das obige ist der detaillierte Inhalt vonOpenAI o1 und o1-mini sind KIs, die MINT-Fragen besser bewältigen als frühere Modelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Die Smartwatch Huawei Watch GT 5 erhält ein Update mit neuen Funktionen Die Smartwatch Huawei Watch GT 5 erhält ein Update mit neuen Funktionen Oct 03, 2024 am 06:25 AM

Huawei führt weltweit die Softwareversion 5.0.0.100 (C00M01) für die Smartwatches Watch GT 5 und Watch GT 5 Pro ein. Diese beiden Smartwatches wurden kürzlich in Europa eingeführt, wobei das Standardmodell das günstigste Modell des Unternehmens ist. Diese Harmonie

Tekkens Colonel Sanders-Traum von KFC gebraten Tekkens Colonel Sanders-Traum von KFC gebraten Oct 02, 2024 am 06:07 AM

Katsuhiro Harada, der Regisseur der Tekken-Serie, versuchte einst ernsthaft, Colonel Sanders in das legendäre Kampfspiel einzubeziehen. In einem Interview mit TheGamer verriet Harada, dass er die Idee dem KFC Japan vorstellte, in der Hoffnung, die Fast-Food-Legende als Gast hinzuzufügen

Erster Blick: Durchgesickertes Unboxing-Video des kommenden Anker Zolo 4-Port 140W Wandladegeräts mit Display Erster Blick: Durchgesickertes Unboxing-Video des kommenden Anker Zolo 4-Port 140W Wandladegeräts mit Display Oct 01, 2024 am 06:32 AM

Anfang September 2024 wurde das 140-W-Ladegerät Zolo von Anker durchgesickert, und das war eine große Sache, da es sich um das erste Wandladegerät mit Display des Unternehmens überhaupt handelte. Jetzt gibt uns ein neues Unboxing-Video von Xiao Li TV auf YouTube einen ersten Blick auf den Hi

Die Bewertungen von Cybertruck FSD loben den schnellen Spurwechsel und die Vollbildvisualisierung Die Bewertungen von Cybertruck FSD loben den schnellen Spurwechsel und die Vollbildvisualisierung Oct 01, 2024 am 06:16 AM

Tesla bringt die neueste Version 12.5.5 des vollständig autonomen Fahrens (Supervised) auf den Markt und bringt damit endlich die versprochene Cybertruck-FSD-Option mit, zehn Monate nachdem der Pickup mit der im Ausstattungspreis der Foundation Series enthaltenen Funktion in den Verkauf ging. F

Der neue Xiaomi Mijia Graphene Oil Heater mit HyperOS ist da Der neue Xiaomi Mijia Graphene Oil Heater mit HyperOS ist da Oct 02, 2024 pm 09:02 PM

Xiaomi wird in Kürze den Mijia Graphene Oil Heater in China auf den Markt bringen. Das Unternehmen führte kürzlich eine erfolgreiche Crowdfunding-Kampagne für das Smart-Home-Produkt durch, die auf seiner Youpin-Plattform gehostet wurde. Laut der Seite hat der Versand des Geräts bereits begonnen

Garmin veröffentlicht über ein neues Update Verbesserungen der Adventure Racing-Aktivität für mehrere Smartwatches Garmin veröffentlicht über ein neues Update Verbesserungen der Adventure Racing-Aktivität für mehrere Smartwatches Oct 01, 2024 am 06:40 AM

Garmin beendet den Monat mit einer Reihe neuer stabiler Updates für seine neuesten High-End-Smartwatches. Um es noch einmal zusammenzufassen: Das Unternehmen hat die Systemsoftware 11.64 veröffentlicht, um den hohen Batterieverbrauch bei Enduro 3, Fenix ​​E und Fenix ​​8 zu bekämpfen (aktuell 1.099,99 $ bei Amazon).

Die Samsung Galaxy Z Fold Special Edition soll Ende Oktober erscheinen, da ein widersprüchlicher Name auftaucht Die Samsung Galaxy Z Fold Special Edition soll Ende Oktober erscheinen, da ein widersprüchlicher Name auftaucht Oct 01, 2024 am 06:21 AM

Die Einführung des lang erwarteten faltbaren „Special Edition“-Modells von Samsung hat eine weitere Wendung genommen. In den letzten Wochen verliefen die Gerüchte um die sogenannte Galaxy Z Fold Special Edition eher ruhig. Stattdessen hat sich der Fokus auf die Galaxy S25-Serie verlagert, darunter

OpenAIs 'größte und teuerste' Big Model GPT-4,5, Preis zum 300-fachen der von Deepseek OpenAIs 'größte und teuerste' Big Model GPT-4,5, Preis zum 300-fachen der von Deepseek Mar 12, 2025 pm 02:21 PM

OpenAI veröffentlichte die Vorschau-Version von GPT-4,5-Forschung, die als "höchste emotionale Intelligenz" -Stile bekannt ist, aber der hohe Preis hat Kontroversen verursacht. Die GPT-4,5-API-Anrufe pro Million Token haben einen Preis von bis zu 75 US-Dollar, 30-mal so hoch wie bei GPT-4, weit über den 0,5 USD (Spitzenwert) von Deekseek-Chat und 0,25 USD (niedriger Peak). Obwohl OpenAI betont, dass GPT-4,5 in der natürlichen Interaktion, das Verständnis von Absichten und die Reduzierung der Halluzinationen verbessert und in schriftlichem und entworfenem Design gut abschnitten, zeigen einige wichtige Benchmark-Ergebnisse, dass seine Leistungsverbesserung nicht das branchenführende Niveau erreicht hat, insbesondere in Bezug auf die Programmierkapazitäten und hat keinen Vorteil gegenüber anderen Modellen. Derzeit wurde GPT-4.5 an ChatgptPR gewöhnt

See all articles