Table des matières
Inflection-2.5 vs GPT-4
Maison Périphériques technologiques IA Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Mar 08, 2024 pm 03:46 PM
ai 模型

Jeudi, la startup américaine d'IA Inflection AI a officiellement publié une nouvelle génération de grand modèle de langage Inflection-2.5.

Selon les rapports, Inflection-2.5 combinera la puissante technologie LLM et la fonction unique de « réglage fin de l'empathie » d'Inflection, intégrant les caractéristiques d'un QE élevé et d'un QI élevé. Il peut obtenir des informations factuelles via Internet et ses performances sont comparables à celles des principaux modèles à grande échelle tels que GPT-4 et Gemini.

Inflection-2.5 est désormais disponible gratuitement pour tous les utilisateurs de Pi sur les applications PC, iOS et Android. Après un simple test réalisé par Heart of the Machine, nous avons constaté qu'il existe encore un certain écart par rapport à GPT-4, mais cela vaut quand même la peine d'essayer. Les utilisateurs intéressés peuvent en faire l’expérience eux-mêmes.

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Lien : https://pi.ai/talk

Il est à noter qu'Inflection-2.5 atteint des performances proches de GPT-4, alors que le processus de formation n'utilise que 40 % de GPT-4 Puissance de calcul.

Inflection AI souligne que la nouvelle génération de modèles à grande échelle a fait des progrès significatifs dans des domaines tels que le codage intelligent et les mathématiques. Ces avancées se traduiront par des améliorations concrètes des principales références de l’industrie, garantissant que Pi reste à la pointe de la technologie. De plus, Pi intègre des capacités de recherche Web en temps réel de classe mondiale pour garantir aux utilisateurs un accès à des actualités de haute qualité et aux dernières informations.

Inflection-2.5 vs GPT-4

Inflection-1 Le FLOP utilisé en formation est d'environ 4% de GPT-4, et sa performance moyenne dans diverses tâches « orientées QI » est d'environ GPT-4 72 % du niveau. Désormais, Inflection-2.5 atteint une performance moyenne de plus de 94 % de GPT-4, malgré l'utilisation de seulement 40 % des FLOP de GPT-4 pour l'entraînement. Comme le montre la figure ci-dessous, les performances d'Inflection-2.5 ont permis d'obtenir des améliorations significatives dans tous les domaines, les plus grandes améliorations étant apportées à la connaissance du domaine STEM. Les résultats de

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

à deux examens STEM différents - l'examen hongrois de mathématiques et l'examen de diplôme d'études supérieures en physique (GRE) - sont les suivants :

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Comme le montre le tableau ci-dessous, le L'étude Inflection-2.5 est également évaluée sur le benchmark MMLU et le benchmark GPQA Diamond. Le benchmark MMLU couvre 57 disciplines en STEM, sciences humaines, sciences sociales et plus encore, testant efficacement les capacités de connaissances complètes du LLM, tandis que le benchmark GPQA Diamond est un benchmark de niveau expert extrêmement difficile.

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Sur le benchmark BIG-Bench-Hard, Inflection-2.5 améliore les performances de plus de 10 % par rapport à Inflection-1 et est comparable à GPT-4. Le benchmark BIG-Bench-Hard couvre principalement des problèmes difficiles à résoudre avec de grands modèles de langage.

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

L'étude a également été évaluée sur le benchmark MT-Bench. Cependant, l'équipe de recherche s'est rendu compte qu'une grande partie (près de 25 %) d'exemples dans les catégories Raisonnement, Mathématiques et Codage comportaient des solutions de référence incorrectes ou des prémisses erronées. Par conséquent, l'étude a corrigé ces exemples et mené à nouveau l'expérience d'évaluation, et les résultats sont présentés dans le tableau ci-dessous :

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Les résultats d'évaluation sur les benchmarks GSM8k et MATH montrent qu'Inflection-2.5 est meilleur qu'Inflection en termes des capacités de mathématiques et de codage -1 présente des améliorations significatives :

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

Afin de tester davantage les capacités de codage d'Inflection-2.5, l'étude a mené des expériences d'évaluation sur deux références de codage, MBPP+ et HumanEval+, et les résultats sont présentés dans le tableau suivant :

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

L'équipe de recherche a évalué Inflection-2.5 sur HellaSwag et ARC-C, ainsi que divers modèles sur la base du bon sens et des références scientifiques. À en juger par les résultats ci-dessous, Inflection-2.5 réalise de solides performances sur ces critères.

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

De plus, toutes les évaluations ci-dessus ont été effectuées à l'aide de modèles désormais compatibles Pi. Cependant, il est également important de noter que l'expérience utilisateur peut varier légèrement en raison de la récupération sur le réseau (les tests ci-dessus n'ont pas utilisé la récupération sur le réseau), de la structure des invites à quelques tirs et d'autres aspects de la production.

En général, Inflection-2.5 conserve les fonctionnalités « centrées sur le cœur » de Pi et les normes de sécurité extrêmement élevées, devenant ainsi un modèle plus complet et plus utile.

Ces derniers temps, la concurrence technologique pour les grands modèles de langage est entrée dans une phase féroce. Parmi de nombreuses entreprises technologiques, Mistral AI (Mistral Large) et Anthropic (Claude 3) se démarquer, la nouvelle technologie proposée atteint des capacités proches de GPT-4 et Gemini Ultra. Inflexion-2.5, apparue hier, semble rejoindre le premier échelon.

En tant que startup star de la Silicon Valley, Inflection AI a une longue histoire. Elle a été fondée en 2022. Ses trois co-fondateurs sont l'ancien co-fondateur de DeepMind Mustafa Suleyman, le co-fondateur de LinkedIn Reid Hoffman et l'ancien chef de DeepMind. Karen Simonyan, scientifique exécutive.

Le nouveau modèle qui défie OpenAI est désormais disponible gratuitement, avec 40 % de la puissance de calcul et des performances proches du GPT-4

En juin de l'année dernière, Inflection AI a annoncé avoir reçu un financement de 1,3 milliard de dollars, dirigé par Microsoft, Nvidia, Reid Hoffman, Bill Gates et l'ancien PDG de Google, Eric Schmidt. Actuellement, Inflection AI est devenue la quatrième plus grande startup d’IA générative au monde.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment afficher correctement le 'Jingnan Mai Round Body' installé localement sur la page Web? Comment afficher correctement le 'Jingnan Mai Round Body' installé localement sur la page Web? Apr 05, 2025 pm 10:33 PM

En utilisant récemment des fichiers de police installés localement dans les pages Web, j'ai téléchargé une police gratuite à partir d'Internet et je l'ai installée avec succès dans mon système. Maintenant...

La production de pages H5 nécessite-t-elle une maintenance continue? La production de pages H5 nécessite-t-elle une maintenance continue? Apr 05, 2025 pm 11:27 PM

La page H5 doit être maintenue en continu, en raison de facteurs tels que les vulnérabilités du code, la compatibilité des navigateurs, l'optimisation des performances, les mises à jour de sécurité et les améliorations de l'expérience utilisateur. Des méthodes de maintenance efficaces comprennent l'établissement d'un système de test complet, à l'aide d'outils de contrôle de version, de surveiller régulièrement les performances de la page, de collecter les commentaires des utilisateurs et de formuler des plans de maintenance.

Où obtenir le matériel pour la production de pages H5 Où obtenir le matériel pour la production de pages H5 Apr 05, 2025 pm 11:33 PM

Les principales sources de matériel H5 Page sont: 1. Site Web de matériel professionnel (payé, de haute qualité, Copyright clair); 2. Matériel fait maison (unicité élevée, mais qui prend du temps); 3. Bibliothèque de matériaux open source (gratuit, doit être soigneusement dépisté); 4. site Web d'image / vidéo (le droit d'auteur vérifié est requis). De plus, le style de matériau unifié, l'adaptation de la taille, le traitement de la compression et la protection des droits d'auteur sont des points clés auxquels il faut faire attention.

Comment sélectionner un élément enfant avec l'élément de nom de première classe via CSS? Comment sélectionner un élément enfant avec l'élément de nom de première classe via CSS? Apr 05, 2025 pm 11:24 PM

Lorsque le nombre d'éléments n'est pas fixé, comment sélectionner le premier élément enfant du nom de classe spécifié via CSS. Lors du traitement de la structure HTML, vous rencontrez souvent différents éléments ...

Pourquoi les marges négatives ne prennent-elles pas effet dans certains cas? Comment résoudre ce problème? Pourquoi les marges négatives ne prennent-elles pas effet dans certains cas? Comment résoudre ce problème? Apr 05, 2025 pm 10:18 PM

Pourquoi les marges négatives ne prennent-elles pas effet dans certains cas? Pendant la programmation, les marges négatives dans CSS (négatif ...

Quels scénarios d'application conviennent à la production de pages H5 Quels scénarios d'application conviennent à la production de pages H5 Apr 05, 2025 pm 11:36 PM

H5 (HTML5) convient aux applications légères, telles que les pages de campagne de marketing, les pages d'affichage des produits et les micro-Websites de promotion d'entreprise. Ses avantages résident dans la plateformité multi-plateaux et une riche interactivité, mais ses limites résident dans des interactions et des animations complexes, un accès aux ressources locales et des capacités hors ligne.

Comment utiliser l'attribut de forme-extérieur de CSS pour réaliser l'effet d'affichage du raccourcissement progressivement du texte? Comment utiliser l'attribut de forme-extérieur de CSS pour réaliser l'effet d'affichage du raccourcissement progressivement du texte? Apr 05, 2025 pm 10:54 PM

Implémentation de l'effet d'affichage du raccourcissement progressivement du texte dans la conception Web, comment réaliser un effet d'affichage de texte spécial pour faire raccourcir progressivement la longueur du texte? Cet effet ...

Comment résoudre le problème du chargement lorsque PS est démarré? Comment résoudre le problème du chargement lorsque PS est démarré? Apr 06, 2025 pm 06:36 PM

Un PS est coincé sur le "chargement" lors du démarrage peut être causé par diverses raisons: désactiver les plugins corrompus ou conflictuels. Supprimer ou renommer un fichier de configuration corrompu. Fermez des programmes inutiles ou améliorez la mémoire pour éviter une mémoire insuffisante. Passez à un entraînement à semi-conducteurs pour accélérer la lecture du disque dur. Réinstaller PS pour réparer les fichiers système corrompus ou les problèmes de package d'installation. Afficher les informations d'erreur pendant le processus de démarrage de l'analyse du journal d'erreur.

See all articles