DeepSeek令人惊讶的廉价AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这是竞争对手使用的资源的一小部分。然而,这种成本效益掩盖了更大的事实。
图片:ensigame.com
DeepSeek V3的创新架构有助于其效率。关键技术包括多型预测(MTP),该预测同时预测了多个单词;专家(MOE)的混合物,采用256个神经网络进行加速培训;和多头潜在注意力(MLA),重点是至关重要的句子元素以提高准确性。
图片:ensigame.com
但是,一份半分析报告显示,基础设施的基础设施要大得多:约有50,000名NVIDIA Hopper GPU,价值约16亿美元,运营成本达到9.44亿美元。这与DeepSeek的初始成本索赔相矛盾,这仅反映了培训前的GPU使用情况,不包括研究,改进,数据处理和整体基础架构。
图片:ensigame.com
DeepSeek的成功源于其巨额投资(在AI开发方面超过5亿美元),技术进步以及高度补偿的团队每年收入超过130万美元。它的独立结构和数据中心的所有权授予其敏捷性和控制权。
图片:ensigame.com
尽管DeepSeek的“预算友好”叙述可以说是夸大的,但其成本仍然大大低于竞争对手。例如,DeepSeek的R1型号的价格为500万美元,而Chatgpt4o的1亿美元。 DeepSeek表明,一家资金充足的独立AI公司可以有效地竞争,尽管其成功源于大量投资,而不仅仅是削减成本。
如何阅读《黑豹》传说:漫威竞争对手的国王之血
Mar 01,2025
炉石传说以无数的新内容开始了猛禽一年
Mar 16,2025
迈凯伦回归 배틀그라운드 合作
Aug 27,2024
Eterspire 更新释放功能,预告未来的增强功能
Jun 04,2023
战猫在十周年之际释放中央情报局使命:解决不可能的事情!
Jan 04,2022
《天堂燃烧红色》英文本地化发布
Nov 17,2021
Starseed 推出 Asnia Trigger 在 Android 上的全球预注册
Oct 03,2022
泰坦之旅 2 已公布,发布日期已公布
Dec 30,2024
三丽鸥入侵热门KartRider Rush+
Dec 13,2024
最新时光公主联名让你装扮成戴珍珠耳环的少女
Oct 01,2023