DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:足球直播吧
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。

官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。

“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。
相关资讯
- 体育战报 | WTT法兰克福冠军赛:张本智和13不敌奥恰洛夫,无缘八强
- 体育战报 | 全运会网球项目选手进行体测,达标者方可参赛
- 体育战报 | 陕西队白钰鸣杨昊摘得全运会男子双人10米跳台冠军
- 体育战报 | 答案揭晓,摩根下一篇专访对象公布:网球“GOAT”德约科维奇
- 体育战报 | 泪目!朱婷轰27分带队爆冷赢卫冕冠军:30岁仍是中国女排最强主攻
- 体育战报 | 乒乓球的反义词是红酒雪茄吧刘德科
- 体育战报 | 高芙砸头仍难逃被萨巴伦卡击败命运,双巴剑指年终总决赛冠军
- 体育战报 | 德约科维奇雅典晋级四强!已确定参赛年终总决赛
- 体育战报 | 全国名校EMBA网球精英赛首落大湾区,12月开启精英对决
- 体育战报 | 萨巴追平莎娃纪录,德约抢七进四强,总决赛抽签结果对阿卡有利
最新资讯
- NBA | 两战12中0!NCAA比CBA强度大,林葳运动战不得分还与一原因有关
- NBA | NBA杯约基奇26+9+9掘金大胜勇士,穆雷23分库里缺席巴特勒16分
- 欧冠 | 开局4连败垫底!欧冠4冠王官宣解雇41岁主帅滕哈格或回归+已谈判
- 欧冠 | 凯拉特中场阿拉德:攻破国米球门是我一生最美好的时刻
- 欧冠 | 曼城金球先生成瓷娃娃!一周双赛瓜帅根本不敢用他
- 中超 | 曝瓦科与泰山队签下三年长约,年薪两千万,两点让其回心转意
- 中超 | 邵佳一照搬教练团队,国足新阵容有望年轻化朱鹏宇+徐彬值得一试
- 中超 | 郑智有望再次执教中超:里皮曾夸赞他有潜力成为中国优秀教练!
- 中超 | 重庆赢球即冲超,1场定张外龙去留对手2外援踢不了向余望破球荒
- 中超 | 瓦科换拉10不现实,大连受困马莱莱合同留刘祝润+佩尼亚不用磨合
