DeepSeek令人驚訝的廉價AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,這是競爭對手使用的資源的一小部分。然而,這種成本效益掩蓋了更大的事實。
圖片:ensigame.com
DeepSeek V3的創新架構有助於其效率。關鍵技術包括多型預測(MTP),該預測同時預測了多個單詞。專家(MOE)的混合物,採用256個神經網絡進行加速培訓;和多頭潛在註意力(MLA),重點是至關重要的句子元素以提高準確性。
圖片:ensigame.com
但是,一份半分析報告顯示,基礎設施的基礎設施要大得多:約有50,000名NVIDIA Hopper GPU,價值約16億美元,運營成本達到9.44億美元。這與DeepSeek的初始成本索賠相矛盾,這僅反映了培訓前的GPU使用情況,不包括研究,改進,數據處理和整體基礎架構。
圖片:ensigame.com
DeepSeek的成功源於其巨額投資(在AI開發方面超過5億美元),技術進步以及高度補償的團隊每年收入超過130萬美元。它的獨立結構和數據中心的所有權授予其敏捷性和控制權。
圖片:ensigame.com
儘管DeepSeek的“預算友好”敘述可以說是誇大的,但其成本仍然大大低於競爭對手。例如,DeepSeek的R1型號的價格為500萬美元,而Chatgpt4o的1億美元。 DeepSeek表明,一家資金充足的獨立AI公司可以有效地競爭,儘管其成功源於大量投資,而不僅僅是削減成本。
2025年Nintendo Switch上的每個神奇寶貝遊戲
Feb 25,2025
Roblox:卡車運輸帝國代碼(2025年1月)
Mar 05,2025
動漫先鋒層列表 - 每個遊戲碼的最佳單元[UPDATE 3.0]
Feb 27,2025
熱門 MMORPG Ragnarok Online 的休閑格鬥衍生作品《波利衝刺》現已推出
Dec 30,2024
如何閱讀《黑豹》傳說:漫威競爭對手的國王之血
Mar 01,2025
NVIDIA RTX 5090規格洩漏:謠言確認?
Mar 14,2025
ragnarok X:下一代 - 完整的結界指南
May 25,2025
明星山谷:一個完整的附魔和武器鍛造指南
Mar 17,2025
Microsoft將Copilot AI集成到Xbox應用程序和遊戲中
May 21,2025
爐石傳說以無數的新內容開始了猛禽一年
Mar 16,2025