Il a été révélé qu'OpenAI publierait un nouveau grand modèle open source Netizens : remplacement de GPT ?-IA-php.cn

Table des matières

OpenAI est sur le point d'ouvrir

Open source et douves

Maison

Périphériques technologiques

Il a été révélé qu'OpenAI publierait un nouveau grand modèle open source Netizens : remplacement de GPT ?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 19, 2023 pm 04:25 PM

openai 模型成分

OpenAI est enfin « Ouvert » !

Les dernières nouvelles sont qu'ils se préparent à publier un nouveau modèle de langage open source.

Après GPT-2, c'est la première fois depuis quatre ans.

De nombreux internautes ont levé la main pour exprimer leurs attentes : vont-ils publier leur propre remplaçant open source ?

Après tout, le meilleur modèle open source actuellement est encore loin du GPT-4. Rien qu’en termes de paramètres, la différence entre les deux est de trois ordres de grandeur, l’un est de 20 milliards et l’autre de 1 300 milliards.

Il a été révélé quOpenAI publierait un nouveau grand modèle open source Netizens : remplacement de GPT ?

OpenAI est sur le point d'ouvrir

Dans ce cas, la décision d'OpenAI "changera-t-elle le paysage concurrentiel de l'ensemble du grand modèle ?" ".

De nombreux internautes ont déclaré que le premier à en faire les frais pourrait être le grand modèle LLaMA, la famille des alpagas.

Après tout, depuis la naissance de ChatGPT, diverses solutions open source ont vu le jour à l'infini, mais la plupart d'entre elles s'inspirent du grand modèle de Meta.

Par exemple, Alpaca de Stanford, Vicuna de Berkeley, Kaola et ColossalChat, ainsi que le modèle de réglage fin LLaMA de l'Institut de technologie de Harbin, Huatuo, basé sur les connaissances médicales chinoises... Certains d'entre eux sont open source les modèles ont même été optimisés au point où ils peuvent L'appareil mobile fonctionne.

Le dernier classement du grand modèle Chatbot Arena créé par l'UC Berkeley montre que de nombreux modèles open source suivent de près GPT-4 et Claude.

Il a été révélé quOpenAI publierait un nouveau grand modèle open source Netizens : remplacement de GPT ?

Cependant, on ne saura pas s'il s'agira d'un "remplacement" avant la version finale.

On ne sait pas non plus si OpenAI utilisera ce modèle pour rivaliser avec d'autres modèles open source similaires.

Selon The Information, citant des personnes proches du dossier, il est certain que ce nouveau modèle open source ne risquera pas de concurrencer GPT.

Au même moment, quelqu'un d'autre nomme Google : Google subit désormais une pression croissante.

Il a été révélé quOpenAI publierait un nouveau grand modèle open source Netizens : remplacement de GPT ?

La question de l'open source et des douves a également suscité de vives discussions.

Open source et douves

Open source ou source fermée ? C'est une question.

Il y a quelque temps, un document interne de Google a fait sensation sur Internet. L'essentiel de celui-ci est très clair :

Open. Source Big Le développement rapide des modèles érode les positions d'OpenAI et de Google.

et a déclaré : « À moins que la position sur les sources fermées ne change, les alternatives open source finiront par les éclipser (y compris ChatGPT). »

À ce stade, ni Google ni OpenAI n'ont de fossé dans cette grande course aux armements modèles.

De nombreux problèmes open source ont été résolus, comme le fonctionnement sur des appareils à faible consommation, l'IA personnelle évolutive, la multimodalité, etc.

Même si OpenAI et Google disposent désormais d'un certain avantage en termes de qualité de modèle, cet écart se réduit rapidement.

Ces dernières semaines, chaque équipe dans le domaine de l'IA open source a fait des progrès continus, que ce soit en termes de modèles ou d'applications.

Par exemple, la startup d'IA Together a construit le mois dernier un grand modèle open source et une plate-forme cloud basée sur LLaMA et a maintenant levé 20 millions de dollars américains en financement de démarrage.

Cette tendance s'est même poursuivie hors ligne, avec de nombreuses personnes se réjouissant et célébrant le mouvement open source.

En plus de lancer une série d'outils de modélisation à grande échelle, le « Open Source Center » HuggingFace a même organisé un rassemblement hors ligne « Woodstock of AI », attirant plus de 5 000 personnes.

Stability AI, la société derrière Stable Diffusion, et Lightning AI, qui a développé PyTorch Lightning, prévoient également d'organiser une réunion d'échange open source.

Aux yeux de nombreuses personnes, OpenAI et Google ont créé un mauvais précédent : les dangers des modèles non surveillés sont réels.

Bien que les modèles de ces grandes entreprises technologiques ne soient peut-être pas entièrement reproductibles, la communauté open source comprend les ingrédients de base de ces « recettes secrètes ». Mais désormais, personne ne peut connaître ses ingrédients.

Que pensez-vous de cette affaire ?

Lien de référence :
[1]https://www.reuters.com/technology/openai-readies-new-open-source-ai-model-information-2023-05- 15/
[2]https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt
[3]https://venturebeat .com/ai/open-source-ai-continues-to-celebrate-as-big-tech-mulls-over-moats/

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7489

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye Apr 26, 2024 am 11:37 AM

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible Jul 19, 2024 am 01:29 AM

Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère

Une seule carte exécute Llama 70B plus rapidement que deux cartes, Microsoft vient de mettre le FP6 dans l'Open source A100 | Apr 29, 2024 pm 04:55 PM

Le FP8 et la précision de quantification inférieure en virgule flottante ne sont plus le « brevet » du H100 ! Lao Huang voulait que tout le monde utilise INT8/INT4, et l'équipe Microsoft DeepSpeed a commencé à exécuter FP6 sur A100 sans le soutien officiel de NVIDIA. Les résultats des tests montrent que la quantification FP6 de la nouvelle méthode TC-FPx sur A100 est proche ou parfois plus rapide que celle de INT4, et a une précision supérieure à celle de cette dernière. En plus de cela, il existe également une prise en charge de bout en bout des grands modèles, qui ont été open source et intégrés dans des cadres d'inférence d'apprentissage profond tels que DeepSpeed. Ce résultat a également un effet immédiat sur l'accélération des grands modèles : dans ce cadre, en utilisant une seule carte pour exécuter Llama, le débit est 2,65 fois supérieur à celui des cartes doubles. un

$Les dernières nouvelles de l'Université d'Oxford ! Mickey : correspondance d'images 2D en 3D SOTA ! (CVPR\'24)$ Les dernières nouvelles de l'Université d'Oxford ! Mickey : correspondance d'images 2D en 3D SOTA ! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

Lien du projet écrit devant : https://nianticlabs.github.io/mickey/ Étant donné deux images, la pose de la caméra entre elles peut être estimée en établissant la correspondance entre les images. En règle générale, ces correspondances sont 2D à 2D et nos poses estimées sont à échelle indéterminée. Certaines applications, telles que la réalité augmentée instantanée, à tout moment et en tout lieu, nécessitent une estimation de pose des métriques d'échelle, elles s'appuient donc sur des estimateurs de profondeur externes pour récupérer l'échelle. Cet article propose MicKey, un processus de correspondance de points clés capable de prédire les correspondances métriques dans l'espace d'une caméra 3D. En apprenant la correspondance des coordonnées 3D entre les images, nous sommes en mesure de déduire des métriques relatives.

Aucune donnée OpenAI requise, rejoignez la liste des grands modèles de code ! UIUC publie StarCoder-15B-Instruct Jun 13, 2024 pm 01:59 PM

À la pointe de la technologie logicielle, le groupe de l'UIUC Zhang Lingming, en collaboration avec des chercheurs de l'organisation BigCode, a récemment annoncé le modèle de grand code StarCoder2-15B-Instruct. Cette réalisation innovante a permis une percée significative dans les tâches de génération de code, dépassant avec succès CodeLlama-70B-Instruct et atteignant le sommet de la liste des performances de génération de code. Le caractère unique de StarCoder2-15B-Instruct réside dans sa stratégie d'auto-alignement pur. L'ensemble du processus de formation est ouvert, transparent et complètement autonome et contrôlable. Le modèle génère des milliers d'instructions via StarCoder2-15B en réponse au réglage fin du modèle de base StarCoder-15B sans recourir à des annotations manuelles coûteuses.

See all articles