首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

By LilyFeb 20,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。这家中国初创公司是高级对冲基金的子公司,声称该公司仅利用2048 GPU,培训了其强大的DeepSeek V3车型,仅需600万美元。这与据报道的1亿美元培训ChatGpt4O成本形成鲜明对比。但是,现实更加细微。

DeepSeek Test图像:ensigame.com

DeepSeek V3利用创新技术:多token预测(MTP),以提高准确性和效率,使用256个神经网络的专家(MOE)的混合物(MOE)来提高性能以及多头潜在注意力(MLA)(MLA)以捕获至关重要的细节。这些进步有助于其竞争优势。

DeepSeek V3图像:ensigame.com

与最初的600万美元索赔相反,一份半分析报告显示,DeepSeek在多个数据中心运营了大约50,000个NVIDIA GPU(包括H800,H100和H20单位),总投资总额为16亿美元,运营成本约为944美元。百万。这包括研究人员的大量薪水,其中一些每年收入超过130万美元。这笔600万美元的数字仅反映了预培训的GPU成本,不包括研发,改进,数据处理和基础架构。

DeepSeek图像:ensigame.com

DeepSeek的成功源于巨大的投资(在AI开发方面超过5亿美元),技术突破以及高技能的团队。尽管它的精益结构有助于创新,但“预算友好”的叙述是过分简化的。该公司对数据中心的自筹资金和所有权比基于云的竞争对手提供了很大的优势。此外,DeepSeek对国内人才(没有外国专家)的关注值得注意。

DeepSeek图像:ensigame.com

尽管成本明确了,DeepSeek的成就突显了资金庞大的独立AI公司与已建立的参与者有效竞争的潜力,即使初始成本索赔需要进一步审查。 DeepSeek的整体投资与最初宣传的培训成本之间的形成鲜明对比突显了AI开发的复杂性。

上一篇:Go Fest 上的提案如潮水般涌来,《Pokémon Go》玩家在马德里找到了真爱 下一篇:runescape揭幕制作110更新:提高技能帽,添加了新功能