DeepSeek令人惊讶的廉价AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这是竞争对手使用的资源的一小部分。然而,这种成本效益掩盖了更大的事实。
图片:ensigame.com
DeepSeek V3的创新架构有助于其效率。关键技术包括多型预测(MTP),该预测同时预测了多个单词;专家(MOE)的混合物,采用256个神经网络进行加速培训;和多头潜在注意力(MLA),重点是至关重要的句子元素以提高准确性。
图片:ensigame.com
但是,一份半分析报告显示,基础设施的基础设施要大得多:约有50,000名NVIDIA Hopper GPU,价值约16亿美元,运营成本达到9.44亿美元。这与DeepSeek的初始成本索赔相矛盾,这仅反映了培训前的GPU使用情况,不包括研究,改进,数据处理和整体基础架构。
图片:ensigame.com
DeepSeek的成功源于其巨额投资(在AI开发方面超过5亿美元),技术进步以及高度补偿的团队每年收入超过130万美元。它的独立结构和数据中心的所有权授予其敏捷性和控制权。
图片:ensigame.com
尽管DeepSeek的“预算友好”叙述可以说是夸大的,但其成本仍然大大低于竞争对手。例如,DeepSeek的R1型号的价格为500万美元,而Chatgpt4o的1亿美元。 DeepSeek表明,一家资金充足的独立AI公司可以有效地竞争,尽管其成功源于大量投资,而不仅仅是削减成本。
如何阅读《黑豹》传说:漫威竞争对手的国王之血
Mar 01,2025
2025年Nintendo Switch上的每个神奇宝贝游戏
Feb 25,2025
炉石传说以无数的新内容开始了猛禽一年
Mar 16,2025
《神力科莎 EVO》发布日期和时间
Jan 05,2025
NVIDIA RTX 5090规格泄漏:谣言确认?
Mar 14,2025
动漫先锋层列表 - 每个游戏码的最佳单元[UPDATE 3.0]
Feb 27,2025
1月15日突然成为《使命召唤:黑色行动》 6个僵尸粉丝
Feb 20,2025
Carmen Sandiego现在在iOS和Android上可用
Feb 20,2025
Starseed 推出 Asnia Trigger 在 Android 上的全球预注册
Oct 03,2022
迈凯伦回归 배틀그라운드 合作
Aug 27,2024
DoorDash - Food Delivery
时尚生活 / 59.30M
更新日期: Apr 23,2025
POW
休闲 / 38.00M
更新日期: Dec 19,2024
Niramare Quest
休闲 / 626.43M
更新日期: Feb 21,2023
Poly Pantheon Chapter One V 1.2
Gamer Struggles
The Golden Boy
Dictator – Rule the World
Mother's Lesson : Mitsuko
Strobe
How To Raise A Happy Neet