首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者:Kristen 更新日期:Mar 05,2025

DeepSeek令人惊讶的廉价AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这是竞争对手使用的资源的一小部分。然而,这种成本效益掩盖了更大的事实。

DeepSeek测试图片:ensigame.com

DeepSeek V3的创新架构有助于其效率。关键技术包括多型预测(MTP),该预测同时预测了多个单词;专家(MOE)的混合物,采用256个神经网络进行加速培训;和多头潜在注意力(MLA),重点是至关重要的句子元素以提高准确性。

DeepSeek V3图片:ensigame.com

但是,一份半分析报告显示,基础设施的基础设施要大得多:约有50,000名NVIDIA Hopper GPU,价值约16亿美元,运营成本达到9.44亿美元。这与DeepSeek的初始成本索赔相矛盾,这仅反映了培训前的GPU使用情况,不包括研究,改进,数据处理和整体基础架构。

DeepSeek图片:ensigame.com

DeepSeek的成功源于其巨额投资(在AI开发方面超过5亿美元),技术进步以及高度补偿的团队每年收入超过130万美元。它的独立结构和数据中心的所有权授予其敏捷性和控制权。

DeepSeek图片:ensigame.com

尽管DeepSeek的“预算友好”叙述可以说是夸大的,但其成本仍然大大低于竞争对手。例如,DeepSeek的R1型号的价格为500万美元,而Chatgpt4o的1亿美元。 DeepSeek表明,一家资金充足的独立AI公司可以有效地竞争,尽管其成功源于大量投资,而不仅仅是削减成本。