首頁 > 新聞 > DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者:Kristen 更新日期:Mar 05,2025

DeepSeek令人驚訝的廉價AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,這是競爭對手使用的資源的一小部分。然而,這種成本效益掩蓋了更大的事實。

DeepSeek測試圖片:ensigame.com

DeepSeek V3的創新架構有助於其效率。關鍵技術包括多型預測(MTP),該預測同時預測了多個單詞。專家(MOE)的混合物,採用256個神經網絡進行加速培訓;和多頭潛在註意力(MLA),重點是至關重要的句子元素以提高準確性。

DeepSeek V3圖片:ensigame.com

但是,一份半分析報告顯示,基礎設施的基礎設施要大得多:約有50,000名NVIDIA Hopper GPU,價值約16億美元,運營成本達到9.44億美元。這與DeepSeek的初始成本索賠相矛盾,這僅反映了培訓前的GPU使用情況,不包括研究,改進,數據處理和整體基礎架構。

DeepSeek圖片:ensigame.com

DeepSeek的成功源於其巨額投資(在AI開發方面超過5億美元),技術進步以及高度補償的團隊每年收入超過130萬美元。它的獨立結構和數據中心的所有權授予其敏捷性和控制權。

DeepSeek圖片:ensigame.com

儘管DeepSeek的“預算友好”敘述可以說是誇大的,但其成本仍然大大低於競爭對手。例如,DeepSeek的R1型號的價格為500萬美元,而Chatgpt4o的1億美元。 DeepSeek表明,一家資金充足的獨立AI公司可以有效地競爭,儘管其成功源於大量投資,而不僅僅是削減成本。