DeepSeek被称AI界拼多多,为何训练2个月仅花557.6万美元?

96 1

深度求索DeepSeek-V3:AI领域成本革命,预训练成本大幅降低 超低预训练成本,DeepSeek-V3引领AI行业新风向 近日,深度求索公司推出的DeepSeek-V3在AI领域引起了广泛关注。这一关注的核心原因,正是其超低的预训练成本。 预训练:AI大模型学习的基石 在AI大模型的学习过程中,“预训练”是一种至关重要的方法。它通过海量的数据,训练出一个庞大的模型。这一过程需要大量的数据和强大的算力支持,每次迭代都可能耗资数百万至数亿美元。 DeepSeek-V3:预训练成本大幅降低 官方技术论文显示,DeepSeek-V3在预训练阶段仅使用了2048块GPU进行2个月的训练,总花费仅为557.6万美元。这一成本相比GPT-4o的1亿美元,降低了十几倍。 深度求索:AI界的“小米” 早在2025年5月,深度求索发布的DeepSeek-V2就因其低廉的定价引发了行业关注,被誉为“AI界的拼多多”。马千里认为,DeepSeek-V3更像是“小米”,贴近成本定价,并且自产自销。 自研架构与算力,DeepSeek-V3的秘诀 马千里指出,DeepSeek-V3训练成本较低的原因,离不开深度求索团队自研的架构和算力。他们拥有与大厂相当的算力储备,并且更注重底层的模型。 数据与算法优化,DeepSeek-V3的巧思 “ChatGPT走的是大参数、大算力、大投入的路子,而DeepSeek-V3的路径则用了更多的巧思。”马千里表示,DeepSeek-V3依托数据与算法层面的优化创新,高效利用算力,实现了较好的模型效果。 深度求索的DeepSeek-V3以其超低的预训练成本,为AI领域带来了新的可能性。随着技术的不断进步,我们有理由相信,DeepSeek-V3将引领AI行业走向更加高效、低成本的未来。

DeepSeek被称AI界拼多多,为何训练2个月仅花557.6万美元?

全平台预约开启!光荣特库摩正版授权三国志,王道天下等你体验

对话无限幻想战线制作人,二次元RTS拓荒者的独家揭秘

银河破裂者大型更新上线啦!海量新内容等你探索

想免费创人气角色?自由篮球多款宝珠服饰春日焕新!

死亡搁浅2,冥滩之上VR训练,沉浸式场景体验揭秘

绝密爆料天才艺术家降临,带你领略瞬间艺术的极致魅力!

小钰深夜买醉登热榜,情伤难愈素颜出镜网友直呼认不出!

任天堂起诉美政府退非法关税,玩家买产品或少花钱

重温经典!洛奇简约优雅西装服饰带你领略别样魅力

马拉松赛车,世界更新上线!新规则玩法怎么玩?

数毛社爆料红色沙漠发售前无PS5版实机测试,玩家担忧升级

英雄联盟外网热议,Bin称史一上需先夺世界冠军

《魔兽世界》新资料片IGN9分:高潮迭起WoW第二春!

Steam新游生存代码正式上线,玩家一致给出特别好评!

梅格与怪物(爱哭少女RPG)好评如潮,终于登陆手机平台

评论列表
  1. WandMagic 回复
    DeepSeek真牛,成本低效果好,我用着体验佳,训练快超赞。