Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. High-Flyer Hedge Fund'ın bir yan kuruluşu olan bu Çinli girişim, güçlü Deepseek V3 modelini sadece 6 milyon dolarlık bir şekilde eğittiğini iddia ediyor ve sadece 2048 GPU kullanıyor. Bu, ChatGPT4O'nun bildirilen 100 milyon dolarlık maliyeti ile keskin bir tezat oluşturuyor. Ancak, gerçek daha nüanslı.
%İmgp%resim: ensigame.com
Deepseek V3, yenilikçi teknolojilerden yararlanır: gelişmiş doğruluk ve verimlilik, gelişmiş performans için 256 sinir ağı kullanan uzmanların (MOE) ve önemli detayları yakalamak için çok katlı gizli dikkat (MLA). Bu gelişmeler rekabet avantajına katkıda bulunur.
%İmgp%resim: ensigame.com
İlk 6 milyon dolarlık talebin aksine, bir yarı tahliye raporu Deepseek'in, birden fazla veri merkezinde yaklaşık 50.000 NVIDIA GPU (H800, H100 ve H20 birimleri dahil), kabaca 1,6 milyar dolarlık toplam yatırımı ve operasyonel maliyetleri temsil eden büyük bir altyapı işlettiğini ve 944 dolarlık toplam 944 dolarlık yatırım maliyetini işlettiğini ortaya koyuyor. milyon. Bu, bazıları yılda 1,3 milyon doların üzerinde kazanan araştırmacılar için önemli maaşlar içerir. 6 milyon dolarlık rakam, Ar-Ge, arıtma, veri işleme ve altyapı hariç, yalnızca eğitim öncesi GPU maliyetlerini yansıtmaktadır.
%İmgp%resim: ensigame.com
Deepseek'in başarısı, önemli yatırımlardan (AI gelişiminde 500 milyon doların üzerinde), teknolojik atılımlardan ve yüksek vasıflı bir ekipten kaynaklanıyor. Yalın yapısı inovasyona yardımcı olurken, "bütçe dostu" anlatı aşırı basitleştirilmedir. Şirketin kendi kendini finanse etmesi ve veri merkezlerinin mülkiyeti, bulut tabanlı rakiplere göre önemli avantajlar sunmaktadır. Dahası, Deepseek'in yerli yeteneklere odaklanması (yabancı uzman yok) dikkat çekicidir.
%İmgp%resim: ensigame.com
Açıklığa kavuşturulmuş maliyetlere rağmen, Deepseek'in başarısı, ilk maliyet iddiaları daha fazla inceleme gerektirse bile, iyi finanse edilen bağımsız AI şirketlerinin yerleşik oyuncularla etkili bir şekilde rekabet etme potansiyelini vurgulamaktadır. Deepseek'in genel yatırımı ile başlangıçta yayınlanan eğitim maliyeti arasındaki keskin kontrast, AI gelişiminin karmaşıklığını vurgulamaktadır.