GPT-4 a refusé d'accepter et a été dépassé par Bard : le dernier modèle est entré sur le marché-IA-php.cn

Table des matières

Chatbot Arena est une liste faisant autorité de grands modèles, créée par l'organisation Imsys (Large Model Systems Organization) dirigée par des chercheurs de l'UC Berkeley.

Maison

Périphériques technologiques

GPT-4 a refusé d'accepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 01, 2024 pm 05:39 PM

谷歌 bard gpt-4

La liste faisant autorité du « Concours de qualification des grands modèles » Chatbot Arena a été actualisée :

Google Bard a dépassé GPT-4 et s'est classé deuxième, juste derrière GPT-4 Turbo.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Cependant, de nombreux internautes ont exprimé leur « mécontentement » et leur « injustice » à ce sujet.

Il s'avère que Jeff Dean, responsable de l'IA de Google, a révélé que les performances de Bard ont été grandement améliorées car il est équipé d'une nouvelle version du grand modèle Gemini Pro-scale.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Cela signifie également que Bard jouant des « matchs classés » a la possibilité de se connecter à Internet.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Les doutes des internautes tournent autour de ce point :

Il est extrêmement facile de provoquer des malentendus en mélangeant de gros modèles en ligne et hors ligne sur un même classement.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Omar Sanseviero, "Chief Alpaca Officer" de Hugging Face, a également déclaré :

Dans ce cas... puis-je également soumettre Mixtral avec fonctionnalité de recherche à lmsys ?

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Face à divers doutes, Imsys a officiellement répondu en déclarant :

Les classements Arena sont en temps réel Si vous avez des questions, vous pouvez comparer directement les modèles et voter dans Arena ; est ouvert et transparent, et des recherches sur la diversité des invites des utilisateurs et la qualité du vote ainsi que les ensembles de données correspondants seront bientôt publiées
Concernant le problème qui préoccupe le plus les internautes, GPT-4, qui a été dépassé par Bard, est un version hors ligne, Imsys a déclaré " Si l'accès aux données en temps réel peut améliorer l'expérience utilisateur, les classements le refléteront. "

Et directement @OpenAI et Bing, ainsi que le dirigeant de Microsoft Mikhail Parakhin, exprimant leur volonté d'ajouter la version en ligne GPT-4 ou Bing Copilot à l'arène.

Les dernières nouvelles sont que le dernier modèle d'OpenAI, gpt-4-0125-preview, est maintenant entré dans l'arène et attend que les utilisateurs participent au vote.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché Comment Bard a-t-il surpassé GPT-4 ?

Chatbot Arena est une liste faisant autorité de grands modèles, créée par l'organisation Imsys (Large Model Systems Organization) dirigée par des chercheurs de l'UC Berkeley.

Ce classement utilise des règles de vote anonymes 1V1battle et est classé sur la base du système de notation Elo.

Plus précisément, la page de vote est la suivante. Les deux modèles, Modèle A et B, sont tous deux anonymes. Les utilisateurs évaluent les réponses du modèle après avoir posé plusieurs questions : A est meilleur, B est meilleur, et A et B. A et B sont tous deux également bons.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché Il convient de mentionner que si l'identité du modèle est divulguée pendant le processus de questions et réponses, le vote sera invalide.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché Selon la liste actuelle, il y a 56 grands modèles dans l'arène :

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché Auparavant, GPT-4 a longtemps dominé la liste avec son score "loin devant" Cependant, après la sortie. de la nouvelle version de Bard, il a directement surpassé GPT- Les deux versions de 4 se sont précipitées à la deuxième place, et n'étaient qu'à 34 points de la première place GPT-4 Turbo :

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché Plus en détail, dans tous les modèles Matchs A contre B sans égalité, Modèle La proportion gagnante de A est la suivante :

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché et le nombre de matchs en tête-à-tête pour chaque paire de combinaisons de modèles

(pas d'égalité)

De plus, les classements Chatbot Arena utilisent le bootstrapping pour échantillonner aléatoirement les estimations du score Elo 1 000 fois afin d'évaluer les intervalles de confiance et plus encore.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Le taux de victoire moyen d'un seul modèle par rapport à tous les autres modèles est le suivant :

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Cependant, il convient de noter que le classement Arena est en temps réel, et bien que Bard soit actuellement classé deuxième, il ne dispose que d'un total de plus de 3 000 voix.

En comparaison, le nombre de votes pour GPT-4 Turbo a atteint plus de 30 000, et les votes des deux versions qui ont été dépassées sont également plusieurs fois supérieurs à ceux de Bard.

GPT-4 a refusé daccepter et a été dépassé par Bard : le dernier modèle est entré sur le marché

Maintenant que la dernière version de GPT-4 est entrée sur le marché (même si elle n'a pas encore été mise à jour sur le classement), nous devons attendre les résultats ultérieurs~

Lien de référence : https:// twitter.com/lmsysorg/status/1752035632489300239.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7492

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment commenter Deepseek Feb 19, 2025 pm 05:42 PM

Deepseek est un puissant outil de récupération d'informations. .

Comment rechercher Deepseek Feb 19, 2025 pm 05:39 PM

Deepseek est un moteur de recherche propriétaire qui ne recherche que dans une base de données ou un système spécifique, plus rapide et plus précis. Lorsque vous l'utilisez, il est conseillé aux utilisateurs de lire le document, d'essayer différentes stratégies de recherche, de demander de l'aide et des commentaires sur l'expérience utilisateur afin de tirer le meilleur parti de leurs avantages.

Sesame Open Door Exchange Page d'enregistrement de page Enregistrement Gate Trading App The Registration Site Web Feb 28, 2025 am 11:06 AM

Cet article présente le processus d'enregistrement de la version Web de Sesame Open Exchange (GATE.IO) et l'application Gate Trading en détail. Qu'il s'agisse de l'enregistrement Web ou de l'enregistrement de l'application, vous devez visiter le site Web officiel ou l'App Store pour télécharger l'application authentique, puis remplir le nom d'utilisateur, le mot de passe, l'e-mail, le numéro de téléphone mobile et d'autres informations et terminer la vérification des e-mails ou du téléphone mobile.

Pourquoi le lien d'échange de Bybit ne peut-il pas être téléchargé directement et installé? Feb 21, 2025 pm 10:57 PM

Pourquoi le lien d'échange de Bybit ne peut-il pas être téléchargé directement et installé? Bybit est un échange de crypto-monnaie qui fournit des services de trading aux utilisateurs. Les applications mobiles de l'échange ne peuvent pas être téléchargées directement via AppStore ou GooglePlay pour les raisons suivantes: 1. La politique de l'App Store empêche Apple et Google d'avoir des exigences strictes sur les types d'applications autorisées dans l'App Store. Les demandes d'échange de crypto-monnaie ne répondent souvent pas à ces exigences car elles impliquent des services financiers et nécessitent des réglementations et des normes de sécurité spécifiques. 2. Conformité des lois et réglementations Dans de nombreux pays, les activités liées aux transactions de crypto-monnaie sont réglementées ou restreintes. Pour se conformer à ces réglementations, l'application ByBit ne peut être utilisée que via des sites Web officiels ou d'autres canaux autorisés

Sesame Open Door Trading Platform Download Version mobile Gateio Trading Plateforme de téléchargement Adresse de téléchargement Feb 28, 2025 am 10:51 AM

Il est crucial de choisir un canal formel pour télécharger l'application et d'assurer la sécurité de votre compte.

Top 10 recommandé pour l'application de trading d'actifs numériques crypto (2025 Global Ranking) Mar 18, 2025 pm 12:15 PM

Cet article recommande les dix principales plates-formes de trading de crypto-monnaie qui méritent d'être prêtées, notamment Binance, Okx, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, Bydfi et Xbit décentralisées. Ces plateformes ont leurs propres avantages en termes de quantité de devises de transaction, de type de transaction, de sécurité, de conformité et de fonctionnalités spéciales. Le choix d'une plate-forme appropriée nécessite une considération complète en fonction de votre propre expérience de trading, de votre tolérance au risque et de vos préférences d'investissement. J'espère que cet article vous aide à trouver le meilleur costume pour vous-même

Binance Binance Site officiel Dernière version Portail de connexion Feb 21, 2025 pm 05:42 PM

Pour accéder à la dernière version du portail de connexion du site Web de Binance, suivez simplement ces étapes simples. Accédez au site officiel et cliquez sur le bouton "Connectez-vous" dans le coin supérieur droit. Sélectionnez votre méthode de connexion existante. Entrez votre numéro de mobile ou votre mot de passe enregistré et votre mot de passe et complétez l'authentification (telles que le code de vérification mobile ou Google Authenticator). Après une vérification réussie, vous pouvez accéder à la dernière version du portail de connexion du site Web officiel de Binance.

La dernière adresse de téléchargement de Bitget en 2025: étapes pour obtenir l'application officielle Feb 25, 2025 pm 02:54 PM

Ce guide fournit des étapes de téléchargement et d'installation détaillées pour l'application officielle Bitget Exchange, adaptée aux systèmes Android et iOS. Le guide intègre les informations de plusieurs sources faisant autorité, y compris le site officiel, l'App Store et Google Play, et met l'accent sur les considérations pendant le téléchargement et la gestion des comptes. Les utilisateurs peuvent télécharger l'application à partir des chaînes officielles, y compris l'App Store, le téléchargement officiel du site Web APK et le saut de site Web officiel, ainsi que des paramètres d'enregistrement, de vérification d'identité et de sécurité. De plus, le guide couvre les questions et considérations fréquemment posées, telles que

See all articles