Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. Cette startup chinoise, une filiale du hedge fund de haut vol, affirme avoir formé son puissant modèle V3 Deepseek pour seulement 6 millions de dollars, utilisant seulement 2048 GPU. Cela contraste fortement avec le coût rapporté de 100 millions de dollars de formation Chatgpt4o. Cependant, la réalité est plus nuancée.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes: prédiction multi-token (MTP) pour une précision et une efficacité améliorées, le mélange d'experts (MOE) employant 256 réseaux de neurones pour une performance améliorée et une attention latente multi-têtes (MLA) pour capturer les détails cruciaux. Ces progrès contribuent à son avantage concurrentiel.
Image: esigame.com
Contrairement à la réclamation initiale de 6 millions de dollars, un rapport de semianalyse révèle que Deepseek exploite une infrastructure massive d'environ 50 000 GPU NVIDIA (y compris les unités H800, H100 et H20 H20) dans plusieurs centres de données, représentant un investissement total d'environ 1,6 milliard de dollars et des coûts opérationnels de 944 $ de 944 $ million. Cela comprend des salaires substantiels pour les chercheurs, certains gagnant plus de 1,3 million de dollars par an. Le chiffre de 6 millions de dollars ne reflète que les coûts de GPU avant la formation, à l'exclusion de la R&D, du raffinement, du traitement des données et de l'infrastructure.
Image: esigame.com
Le succès de Deepseek découle des investissements importants (plus de 500 millions de dollars en développement de l'IA), des percées technologiques et une équipe hautement qualifiée. Alors que sa structure allégée aide à l'innovation, le récit "budgétaire" est une simplification excessive. L'auto-financement et la propriété de ses centres de données de l'entreprise offrent des avantages importants par rapport aux concurrents basés sur le cloud. En outre, la focalisation de Deepseek sur les talents nationaux (pas de spécialistes étrangers) est remarquable.
Image: esigame.com
Malgré les coûts clarifiés, la réalisation de Deepseek met en évidence le potentiel que les entreprises d'IA indépendantes bien financées rivalisent efficacement avec les acteurs établis, même si les réclamations de coûts initiales nécessitent un examen plus approfondi. Le contraste frappant entre l'investissement global de Deepseek et le coût de formation initialement médiatisé souligne la complexité du développement de l'IA.