Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. Questa startup cinese, una consociata di hedge fund ad alto flyer, afferma di aver formato il suo potente modello DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU. Ciò contrasta bruscamente con il costo di $ 100 milioni di dollari di formazione GATGPT4O. Tuttavia, la realtà è più sfumata.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: previsione multi-dire (MTP) per una migliore accuratezza ed efficienza, miscela di esperti (MOE) che impiegano 256 reti neurali per prestazioni migliorate e l'attenzione latente multi-testa (MLA) per catturare dettagli cruciali. Questi progressi contribuiscono al suo vantaggio competitivo.
Immagine: Ensigame.com
Contrariamente al reclamo iniziale di $ 6 milioni, un rapporto di seminalisi rivela che DeepSeek gestisce una massiccia infrastruttura di circa 50.000 GPU NVIDIA (tra cui H800, H100 e unità H20) su più data center, con un investimento totale di circa $ 1,6 miliardi e costi operativi di $ 944 milione. Ciò include salari sostanziali per i ricercatori, alcuni guadagnando oltre $ 1,3 milioni all'anno. La cifra di 6 milioni di dollari riflette solo i costi di GPU pre-allenamento, escluso la ricerca e sviluppo, la raffinatezza, l'elaborazione dei dati e l'infrastruttura.
Immagine: Ensigame.com
Il successo di Deepseek deriva da investimenti significativi (oltre $ 500 milioni nello sviluppo dell'IA), scoperte tecnologiche e un team altamente qualificato. Mentre la sua struttura snella aiuta l'innovazione, la narrazione "economica" è una semplificazione eccessiva. L'autofinanziamento e la proprietà dell'azienda dei suoi data center offrono vantaggi significativi rispetto ai concorrenti basati su cloud. Inoltre, l'attenzione di Deepseek sul talento interno (nessun specialisti stranieri) è degno di nota.
Immagine: Ensigame.com
Nonostante i costi chiarificati, il rendimento di Deepseek evidenzia il potenziale per società di intelligenza artificiale indipendenti ben finanziate di competere in modo efficace con i giocatori affermati, anche se le richieste di costo iniziali richiedono un ulteriore controllo. Il netto contrasto tra l'investimento complessivo di Deepseek e il costo di formazione inizialmente pubblicizzato sottolinea la complessità dello sviluppo dell'IA.