Ang nakakagulat na Deepseek ay murang mga hamon sa modelo ng AI na mga higante sa industriya. Ang pagsisimula ng Tsino na ito, isang subsidiary ng high-flyer hedge fund, ay sinasabing sinanay ang malakas na modelo ng Deepseek V3 para sa isang $ 6 milyon lamang, na gumagamit lamang ng 2048 GPU. Ang kaibahan nito nang matindi sa naiulat na $ 100 milyong gastos ng pagsasanay ChATGPT4O. Gayunpaman, ang katotohanan ay mas nakakainis.
Imahe: ensigame.com
Ang Deepseek V3 ay gumagamit ng mga makabagong teknolohiya: Multi-Token Prediction (MTP) para sa pinahusay na kawastuhan at kahusayan, pinaghalong mga eksperto (MOE) na gumagamit ng 256 neural network para sa pinahusay na pagganap, at multi-head latent pansin (MLA) upang makuha ang mga mahahalagang detalye. Ang mga pagsulong na ito ay nag -aambag sa mapagkumpitensyang gilid nito.
Imahe: ensigame.com
Taliwas sa paunang pag -angkin ng $ 6 milyon, ang isang ulat ng semianalysis ay nagpapakita ng Deepseek ay nagpapatakbo ng isang napakalaking imprastraktura na humigit -kumulang na 50,000 NVIDIA GPU (kasama ang H800, H100, at H20 na mga yunit) sa maraming mga sentro ng data, na kumakatawan sa isang kabuuang pamumuhunan ng halos $ 1.6 bilyon at mga gastos sa pagpapatakbo ng $ 944 milyon. Kasama dito ang malaking suweldo para sa mga mananaliksik, ang ilan ay kumikita ng higit sa $ 1.3 milyon taun -taon. Ang $ 6 milyong figure ay sumasalamin lamang sa mga pre-pagsasanay na gastos sa GPU, hindi kasama ang R&D, pagpipino, pagproseso ng data, at imprastraktura.
Imahe: ensigame.com
Ang tagumpay ng Deepseek ay nagmula sa makabuluhang pamumuhunan (higit sa $ 500 milyon sa pag -unlad ng AI), mga tagumpay sa teknolohiya, at isang mataas na bihasang koponan. Habang ang sandalan na istraktura nito ay tumutulong sa pagbabago, ang "badyet-friendly" na salaysay ay isang oversimplification. Ang pagpopondo ng sarili at pagmamay-ari ng kumpanya ng mga sentro ng data nito ay nagbibigay ng makabuluhang pakinabang sa mga kakumpitensya na nakabase sa ulap. Bukod dito, ang pokus ng Deepseek sa domestic talent (walang mga dayuhang espesyalista) ay kapansin -pansin.
Imahe: ensigame.com
Sa kabila ng nilinaw na mga gastos, ang tagumpay ng Deepseek ay nagtatampok ng potensyal para sa mahusay na pondo na independiyenteng mga kumpanya ng AI upang makipagkumpetensya nang epektibo sa mga naitatag na manlalaro, kahit na ang mga paunang pag-angkin ng gastos ay nangangailangan ng karagdagang pagsusuri. Ang kaibahan ng Stark sa pagitan ng pangkalahatang pamumuhunan ng Deepseek at ang una ay nai -publish na gastos sa pagsasanay ay binibigyang diin ang pagiging kumplikado ng pag -unlad ng AI.