首頁 > 新聞 > DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

By LilyFeb 20,2025

DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。這家中國初創公司是高級對衝基金的子公司,聲稱該公司僅利用2048 GPU,培訓了其強大的DeepSeek V3車型,僅需600萬美元。這與據報道的1億美元培訓ChatGpt4O成本形成鮮明對比。但是,現實更加細微。

DeepSeek Test圖像:ensigame.com

DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率,使用256個神經網絡的專家(MOE)的混合物(MOE)來提高性能以及多頭潛在注意力(MLA)(MLA)以捕獲至關重要的細節。這些進步有助於其競爭優勢。

DeepSeek V3圖像:ensigame.com

與最初的600萬美元索賠相反,一份半分析報告顯示,DeepSeek在多個數據中心運營了大約50,000個NVIDIA GPU(包括H800,H100和H20單位),總投資總額為16億美元,運營成本約為944美元。百萬。這包括研究人員的大量薪水,其中一些每年收入超過130萬美元。這筆600萬美元的數字僅反映了預培訓的GPU成本,不包括研發,改進,數據處理和基礎架構。

DeepSeek圖像:ensigame.com

DeepSeek的成功源於巨大的投資(在AI開發方麵超過5億美元),技術突破以及高技能的團隊。盡管它的精益結構有助於創新,但“預算友好”的敘述是過分簡化的。該公司對數據中心的自籌資金和所有權比基於雲的競爭對手提供了很大的優勢。此外,DeepSeek對國內人才(沒有外國專家)的關注值得注意。

DeepSeek圖像:ensigame.com

盡管成本明確了,DeepSeek的成就突顯了資金龐大的獨立AI公司與已建立的參與者有效競爭的潛力,即使初始成本索賠需要進一步審查。 DeepSeek的整體投資與最初宣傳的培訓成本之間的形成鮮明對比突顯了AI開發的複雜性。

上一篇文章:Go Fest 上的提案如潮水般湧來,《Pokémon Go》玩家在馬德里找到了真愛 下一篇:runescape揭幕製作110更新:提高技能帽,添加了新功能