Maison Tutoriel matériel Actualités matérielles OpenAI o1 et o1-mini arrivent en tant qu'IA qui gèrent mieux les questions STEM que les modèles précédents

OpenAI o1 et o1-mini arrivent en tant qu'IA qui gèrent mieux les questions STEM que les modèles précédents

Sep 19, 2024 am 03:22 AM
openai laptop test Notebook review reviews tests reports netbook STEM o1 o1-mini

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 et o1-mini sont arrivés. Ces LLM d'IA fonctionnent bien mieux sur les problèmes et tâches de codage, de mathématiques et de sciences que les modèles précédents tels que GPT-4o en prenant plus de temps de réflexion.

Les problèmes complexes dans les domaines STEM nécessitent généralement plus qu'une recherche rapide en ligne pour trouver les bonnes réponses. En donnant à l’IA o1 plus de temps pour réfléchir, elle peut raisonner avec plus de soin et de précision. Le modèle o1-mini a été spécialement conçu pour répondre aux questions STEM avec une vitesse plus rapide et une moindre demande en ressources informatiques, et il est nettement meilleur en matière de codage que le modèle o1.

Dans une gamme d'examens AP standardisés et de tests STEM pour les LLM, les modèles o1 fonctionnent avec une grande précision. Plus précisément, dans les tests de lecture et d'écriture fondés sur des preuves AP Calculus, AP Chemistry, AP Physics 2, LSAT et SAT, les modèles o1 fonctionnent au niveau B ou au-dessus (~ 80 % ou plus). Les modèles répondent avec précision au niveau A aux questions de physique de niveau doctorat, au niveau B aux questions mathématiques difficiles de l'American Invitational Mathematics Examination 2024 et au niveau B élevé sur les problèmes de codage Codeforces. Étant donné que o1 a été conçu pour répondre aux questions STEM, ses performances en langue anglaise AP et en littérature anglaise AP sont égales ou inférieures au niveau C.

Fait intéressant, alors que GPT-4o est abasourdi par le défi cryptographique du décodage de « oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz » lorsqu'on lui donne l'indice « oyfjdnisdr rtqwainr acxz mynzbhhx » signifie « Pensez étape par étape », o1 n'a eu aucun problème. réfléchir au problème pour trouver la bonne réponse « Il y a trois r dans la fraise ». Ce nouveau pouvoir ravira les cryptographes amateurs chez eux ainsi que la NSA.

Les malfaiteurs du placard voudront savoir que même si les modèles o1 non censurés sont susceptibles de donner des réponses troublantes, OpenAI a stérilisé ces modèles pour leur publication. Les modèles o1 ont été testés pour résister aux questions sur la fabrication d'armes biologiques, la production d'images coquines, le jailbreak, le harcèlement et les menaces. Malheureusement, les modèles OpenAI o1 restent biaisés en fonction du sexe et de la race lorsqu'ils sont testés, malgré les efforts de réglage.

Les utilisateurs de ChatGPT Plus et Team ainsi que les développeurs de niveau 5 d'utilisation de l'API ont immédiatement accès aux modèles o1, et les utilisateurs de ChatGPT Edu et Enterprise y auront accès la semaine du 16 septembre. Les utilisateurs de ChatGPT Free auront accès à o1- mini dans un futur proche. Les modèles o1 ne peuvent pas naviguer sur le Web ni accepter de fichiers et d'images téléchargés pour répondre aux questions. OpenAI recommande donc aux utilisateurs de continuer à utiliser leurs modèles GPT-4o pour les questions générales.

Les utilisateurs qui souhaitent poser des questions sur l'IA disposent désormais d'un large éventail de modèles LLM performants avec lesquels interagir en plus de ceux d'OpenAI, notamment Anthropic Claude, Microsoft CoPilot, Google Gemini et X Grok. Chaque IA présente des avantages spécifiques, il vaut donc la peine de tester plusieurs modèles d’IA pour trouver celui qui répond le mieux aux besoins individuels. Certaines de ces IA sont intégrées à des lunettes intelligentes (comme celles-ci sur Amazon) et à des enregistreurs vocaux (comme celui-ci sur Amazon), et certains robots humanoïdes autonomes à venir utilisent une IA propriétaire pour cuisiner et nettoyer.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

La montre intelligente Huawei Watch GT 5 reçoit une mise à jour avec de nouvelles fonctionnalités La montre intelligente Huawei Watch GT 5 reçoit une mise à jour avec de nouvelles fonctionnalités Oct 03, 2024 am 06:25 AM

Huawei déploie la version logicielle 5.0.0.100 (C00M01) pour les montres intelligentes Watch GT 5 et Watch GT 5 Pro dans le monde entier. Ces deux montres intelligentes ont récemment été lancées en Europe, le modèle standard étant le modèle le moins cher de l’entreprise. Cette harmonie

Le rêve du colonel Sanders de Tekken frit par KFC Le rêve du colonel Sanders de Tekken frit par KFC Oct 02, 2024 am 06:07 AM

Katsuhiro Harada, le réalisateur de la série Tekken, a un jour sérieusement tenté d'impliquer le colonel Sanders dans le jeu de combat emblématique. Dans une interview avec TheGamer, Harada a révélé qu'il avait présenté l'idée à KFC Japon, dans l'espoir d'ajouter la légende de la restauration rapide comme g

Premier aperçu : fuite de la vidéo de déballage du prochain chargeur mural Anker Zolo à 4 ports 140 W avec écran Premier aperçu : fuite de la vidéo de déballage du prochain chargeur mural Anker Zolo à 4 ports 140 W avec écran Oct 01, 2024 am 06:32 AM

Plus tôt en septembre 2024, le chargeur Zolo 140 W d'Anker a fait l'objet d'une fuite, et c'était un gros problème puisqu'il s'agissait du tout premier chargeur mural doté d'un écran de l'entreprise. Maintenant, une nouvelle vidéo de déballage de Xiao Li TV sur YouTube nous donne un aperçu direct du salut.

Les critiques de Cybertruck FSD font l'éloge du changement de voie rapide et des visualisations en plein écran Les critiques de Cybertruck FSD font l'éloge du changement de voie rapide et des visualisations en plein écran Oct 01, 2024 am 06:16 AM

Tesla déploie la dernière version 12.5.5 de conduite entièrement autonome (supervisée) et avec elle vient enfin l'option Cybertruck FSD promise, dix mois après la mise en vente du pick-up avec la fonctionnalité incluse dans le prix de finition de la série Foundation. F

Le nouveau chauffe-huile en graphène Xiaomi Mijia avec HyperOS arrive Le nouveau chauffe-huile en graphène Xiaomi Mijia avec HyperOS arrive Oct 02, 2024 pm 09:02 PM

Xiaomi lancera prochainement le chauffe-huile Mijia Graphene en Chine. La société a récemment mené avec succès une campagne de financement participatif pour le produit de maison intelligente, hébergé sur sa plateforme Youpin. Selon la page, l'appareil a déjà commencé à être expédié vers

Garmin publie des améliorations de l'activité Adventure Racing pour plusieurs montres intelligentes via une nouvelle mise à jour Garmin publie des améliorations de l'activité Adventure Racing pour plusieurs montres intelligentes via une nouvelle mise à jour Oct 01, 2024 am 06:40 AM

Garmin termine le mois avec une nouvelle série de mises à jour stables pour ses dernières montres intelligentes haut de gamme. Pour récapituler, la société a publié le logiciel système 11.64 pour lutter contre l'épuisement élevé de la batterie des Enduro 3, Fenix ​​E et Fenix ​​8 (prix actuel : 1 099,99 $ sur Amazon).

Le Samsung Galaxy Z Fold Special Edition a été révélé pour atterrir fin octobre alors que des noms contradictoires émergent Le Samsung Galaxy Z Fold Special Edition a été révélé pour atterrir fin octobre alors que des noms contradictoires émergent Oct 01, 2024 am 06:21 AM

Le lancement du très attendu pliable « Special Edition » de Samsung a pris une autre tournure. Ces dernières semaines, les rumeurs concernant le soi-disant Galaxy Z Fold Special Edition sont devenues plutôt silencieuses. Au lieu de cela, l’accent s’est déplacé vers la série Galaxy S25, y compris

Le grand modèle 'le plus grand et le plus cher' d'Openai GPT-4.5, au prix de 300 fois celui de Deepseek Le grand modèle 'le plus grand et le plus cher' d'Openai GPT-4.5, au prix de 300 fois celui de Deepseek Mar 12, 2025 pm 02:21 PM

OpenAI a publié la version de prévisualisation de GPT-4.5 Research, connu sous le nom de modèle de langue grand «l'intelligence émotionnelle la plus élevée», mais le prix élevé a provoqué une controverse. Les appels API GPT-4.5 par million de jetons sont au prix de 75 $, 30 fois celui de GPT-4, dépassant de loin 0,5 $ (pic) de Deepseek-chat et 0,25 $ (pic bas). Bien que OpenAI souligne que le GPT-4.5 s'est amélioré dans l'interaction naturelle, la compréhension des intentions et la réduction des hallucinations, et a bien performé à l'écriture et à la conception, certains résultats de référence clés montrent que son amélioration des performances n'a pas atteint le niveau de pointe, en particulier en termes de capacités de programmation, et n'a aucun avantage par rapport à d'autres modèles. Actuellement, GPT-4.5 a été utilisé pour chatpptpr

See all articles