Chatgpt a un nouveau rival: Meet Deepseek-iPhone-php.cn

Chatgpt a un nouveau rival: Meet Deepseek

Mary-Kate Olsen

Libérer： 2025-02-06 11:33:08

original

351 Les gens l'ont consulté

La startup chinoise Deepseek a stupéfait les plus grands joueurs de la Silicon Valley avec son nouveau chatbot d'IA qui rivalise avec les performances du chatppt d'Openai tout en coûtant beaucoup moins à développer. Sur l'App Store d'Apple comme l'application gratuite la plus téléchargée aux États-Unis, le Royaume-Uni, la Chine et plusieurs autres pays. Il fonctionne comme un chatbot typique: vous entrez une requête, et son modèle open source génère une réponse. Le modèle sous-jacent Deepseek-V3 comporte 671 milliards de paramètres, permettant à l'application de «penser» avant de résoudre le problème.

Contrairement au modèle d'Openai, qui ne peut fonctionner que sur ses propres serveurs, Deepseek peut fonctionner localement sur Des ordinateurs plus puissants et de nombreux serveurs accélérés par le GPU. La société affirme que son modèle correspond au modèle O1 d'OpenAI sur des repères spécifiques. Contrairement à de nombreux autres chatbots d'IA, Deepseek montre également de manière transparente son raisonnement et comment il a dérivé une réponse. En tant qu'application chinoise, cependant, Deepseek censure certains sujets tels que Tiananmen Square.

L'application, publiée le 20 janvier, est également disponible dans Google’s Play Store. Deepseek doit sa popularité soudaine à sa capacité à égaler ou à un seul modèle d'IA établi. Son document de recherche, publié lundi, révèle à quel point la formation est rentable Deepseek-V3 est.

Chatgpt a un nouveau rival: Meet Deepseek Bien que ses affirmations n'aient pas encore été vérifiées, Deepseek a apparemment utilisé seulement 2 048 spécialisés Nvidia H800 Chips pour former R1 par rapport aux plus de 16 000 puces Nvidia pour former les principaux modèles d'Openai. Deepseek affirme que la réduction drastique du nombre de GPU de pointe requis pour la formation en IA lui a permis de dépenser seulement 5,6 millions de dollars pour former R1. Comparez cela avec Openai, qui a dépensé plus de 100 millions de dollars pour former son modèle GPT-4 de taille comparable. Cependant, la société n'a pas quantifié la consommation d'énergie de Deepseek par rapport aux concurrents.

R1 lui-même est basé sur le modèle de grande langue V3 de Deepseek (LLM), qui, selon la société, correspond au GPT-4O et au sonnet Claude 3.5 d'Anthropic. La réalisation de Deepseek est particulièrement impressionnante à la lumière du gouvernement américain imposant des sanctions commerciales sur des puces Nvidia sophistiquées utilisées pour la formation de l'IA. Avec les plus grands joueurs d'IA comme les dépenses de Nvidia, Openai, Meta et Microsoft à hauteur de milliards dans leurs centres de données d'IA, nous allons voir beaucoup de gros titres cette semaine en remettant en question l'avance de l'Amérique en IA.

Il sera fascinant de voir comment la percée de Deepseek affecte le projet Billion Stargate de l'administration Trump - soutenu par Openai, SoftBank et Oracle - avec l'objectif d'investir 500 milliards de dollars dans la construction de nouvelles infrastructures d'IA et des centres de données pour Openai au cours du prochain Quatre ans. Les choses vont être particulièrement intéressantes car Openai passe d'un organisme sans but lucratif à une organisation à but lucratif, car Deepseek a open source ses modèles d'IA.

Meta a également open, certains aspects de sa technologie AI , comme le LAMA LLM. Pourtant, Deepseek est un nouvel enfant sur le bloc dont tout le monde parle, et le fait que les développeurs peuvent s'appuyer librement sur la technologie de Deepseek peut donner à Openai une course pour son argent.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!