Deepseek fait des vagues dans le monde de l'IA, des leaders de l'industrie remettant en question comme Openai, Claude et Meta avec ses modèles puissants et disponibles gratuitement. Le succès de l'entreprise avec Deepseek V3, le modèle de raisonnement avancé Deepseek R1, et le modèle de vision Janus Pro 7b - tous développés à un coût remarquablement bas de 5 millions de dollars - ont suscité une curiosité intense pour son modèle commercial. Comment Deepseek peut-il offrir ces modèles de pointe gratuitement et encore profit? Examinons leur approche non conventionnelle.
En son cœur, Deepseek est une société de trading quantitative, créant des algorithmes pour un échange rentable. Cette expertise mathématique et d'optimisation a probablement joué un rôle crucial dans le développement de la R1 profonde. La société aurait un nombre important de GPU, initialement utilisés pour le commerce et l'exploitation minière, qui sont désormais efficacement réutilisés pour le développement et le déploiement du modèle d'IA. Les initiatives d'IA de Deepseek semblent être un projet parallèle stratégiquement avantageux tirant parti des ressources existantes.
Deepseek est un projet parallèle. pic.twitter.com/5shpjolmvm
- Sphinx (@protosphinx) 23 janvier 2025
En Open-Sourcing Deepseek V3 et R1 (y compris les poids ouverts), Deepseek a considérablement perturbé le paysage de l'IA. Cela remet en question directement des entreprises comme Openai et Claude, qui ont investi des milliards dans des modèles propriétaires. La nature open source de Deepseek R1 permet une reproduction et une utilisation généralisées, ce qui suggère que l'objectif principal de Deepseek pourrait être la perturbation et l'influence de l'industrie, plutôt qu'une maximisation immédiate du profit.
lié: les coûts de formation IA étonnamment bas de Deepseek
Deepseek est un réveil pour l'Amérique, mais il ne change pas la stratégie:
- Les États-Unis doivent ouvrir et courir plus vite, comme nous l'avons fait dans toute l'histoire de l'IA - Serrez les commandes d'exportation sur les puces afin que nous puissions maintenir les prospects futurs
Chaque percée majeure de l'IA a été américaine
- Alexandr Wang (@alexandr_wang) 26 janvier 2025
Le succès de Deepseek met en évidence les préoccupations concernant la compétitivité des entreprises technologiques américaines. Sa capacité à créer un modèle de premier plan à une fraction du coût soulève des questions sur les investissements massifs réalisés par les entreprises américaines. Certains analystes voient la stratégie de Deepseek comme une forme de concurrence économique, visant à saper la rentabilité des entreprises américaines d'IA.
En savoir plus: l'impact de Deepseek sur l'industrie de l'IA
Deepseek par Deepseek Open-Sourcing of R1 est une victoire significative pour la communauté open-source. Il permet aux petites entreprises et aux chercheurs de rivaliser avec des systèmes d'IA plus grands et propriétaires, s'alignant sur la tendance croissante de la démocratiser l'IA via des modèles open source.
Deepseek (Chinese AI Co), ce qui le rend facile aujourd'hui avec une version ouverte d'un LLM de qualité frontalière formée sur une blague de budget (2048 GPU pour 2 mois, 6 millions de dollars).
Pour référence, ce niveau de capacité est censé nécessiter des grappes de GPU plus proches de 16K, ceux étant… https://www.php.cn/link/acf73df8e44ed30badb8a834a87f7e94
- Andrej Karpathy (@Karpathy) 26 décembre 2024
quels que soient les coûts de formation, l'avenir de l'IA dépend probablement des ressources de calcul. À mesure que les modèles avancent, les exigences d'inférence augmenteront de façon exponentielle. L'efficacité de Deepseek dans ce domaine pourrait fournir un avantage concurrentiel à long terme substantiel.
Lire plus approfondie:
La stratégie de monétisation de Deepseek est à multiples facettes, tirant parti de son expertise de trading quantitative, de l'utilisation optimisée du GPU et d'une API à faible coût. Son approche open source perturbe l'industrie de l'IA et la positionne comme un acteur majeur de la course mondiale sur l'IA. Qu'il s'agisse d'un défi stratégique pour la domination américaine ou une contribution à la communauté open source, Deepseek a indéniablement remodelé le paysage de l'IA.
Suivez les dernières informations sur l'IA sur le blog Analytics Vidhya!
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!