Deepseek's verrassend goedkope AI -model daagt reuzen uit de industrie uit. Deze Chinese startup, een dochteronderneming van hoogvlieger hedgefonds, beweert zijn krachtige Deepseek V3-model te hebben getraind voor slechts $ 6 miljoen, met slechts 2048 GPU's. Dit contrasteert scherp met de gerapporteerde kosten van $ 100 miljoen voor het trainen van chatgpt4o. De realiteit is echter genuanceerder.
afbeelding: ensigame.com
Deepseek V3 maakt gebruik van innovatieve technologieën: multi-token voorspelling (MTP) voor verbeterde nauwkeurigheid en efficiëntie, mengsel van experts (MOE) met 256 neurale netwerken voor verbeterde prestaties, en multi-head latent aandacht (MLA) om cruciale details vast te leggen. Deze vorderingen dragen bij aan zijn concurrentievoordeel.
afbeelding: ensigame.com
In tegenstelling tot de initiële claim van $ 6 miljoen, blijkt uit een Semianysis -rapport dat Deepseek een massale infrastructuur heeft van ongeveer 50.000 NVIDIA GPU's (inclusief H800, H100 en H20 -eenheden) over meerdere datacenters, met een totale investering van ongeveer $ 1,6 miljard en operationele kosten van $ 944 miljoen. Dit omvat substantiële salarissen voor onderzoekers, sommige verdienen jaarlijks meer dan $ 1,3 miljoen. Het cijfer van $ 6 miljoen weerspiegelt alleen PRPU-kosten voor de training, exclusief R&D, verfijning, gegevensverwerking en infrastructuur.
afbeelding: ensigame.com
Het succes van Deepseek komt voort uit aanzienlijke investeringen (meer dan $ 500 miljoen in AI -ontwikkeling), technologische doorbraken en een zeer bekwaam team. Terwijl de lean structuur innovatie helpt, is het "budgetvriendelijke" verhaal een vereenvoudiging. Het zelffinanciering en eigendom van het bedrijf van zijn datacenters bieden aanzienlijke voordelen ten opzichte van cloudgebaseerde concurrenten. Bovendien is de focus van Deepseek op binnenlands talent (geen buitenlandse specialisten) opmerkelijk.
afbeelding: ensigame.com
Ondanks de verduidelijkte kosten, benadrukt de prestatie van Deepseek het potentieel voor goed gefinancierde onafhankelijke AI-bedrijven om effectief te concurreren met gevestigde spelers, zelfs als de initiële kostenclaims verder controle vereisen. Het grimmige contrast tussen de algemene investering van Deepseek en de aanvankelijk gepubliceerde trainingskosten onderstreept de complexiteit van AI -ontwikkeling.