DeepSeek令人驚訝的廉價AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,這是競爭對手使用的資源的一小部分。然而,這種成本效益掩蓋了更大的事實。
圖片:ensigame.com
DeepSeek V3的創新架構有助於其效率。關鍵技術包括多型預測(MTP),該預測同時預測了多個單詞。專家(MOE)的混合物,採用256個神經網絡進行加速培訓;和多頭潛在註意力(MLA),重點是至關重要的句子元素以提高準確性。
圖片:ensigame.com
但是,一份半分析報告顯示,基礎設施的基礎設施要大得多:約有50,000名NVIDIA Hopper GPU,價值約16億美元,運營成本達到9.44億美元。這與DeepSeek的初始成本索賠相矛盾,這僅反映了培訓前的GPU使用情況,不包括研究,改進,數據處理和整體基礎架構。
圖片:ensigame.com
DeepSeek的成功源於其巨額投資(在AI開發方面超過5億美元),技術進步以及高度補償的團隊每年收入超過130萬美元。它的獨立結構和數據中心的所有權授予其敏捷性和控制權。
圖片:ensigame.com
儘管DeepSeek的“預算友好”敘述可以說是誇大的,但其成本仍然大大低於競爭對手。例如,DeepSeek的R1型號的價格為500萬美元,而Chatgpt4o的1億美元。 DeepSeek表明,一家資金充足的獨立AI公司可以有效地競爭,儘管其成功源於大量投資,而不僅僅是削減成本。
如何閱讀《黑豹》傳說:漫威競爭對手的國王之血
Mar 01,2025
爐石傳說以無數的新內容開始了猛禽一年
Mar 16,2025
麥克拉倫回歸 배틀그라운드 合作
Aug 27,2024
Eterspire 更新釋放功能,預告未來的增強功能
Jun 04,2023
戰貓在十周年之際釋放中央情報局使命:解決不可能的事情!
Jan 04,2022
《天堂燃燒紅色》英文本地化發布
Nov 17,2021
Starseed 推出 Asnia Trigger 在 Android 上的全球預注冊
Oct 03,2022
泰坦之旅 2 已公佈,發售日期已公佈
Dec 30,2024
三麗鷗入侵熱門KartRider Rush+
Dec 13,2024
最新時光公主聯名讓你裝扮成戴珍珠耳環的少女
Oct 01,2023