AI界惊现50美元奇迹,李飞飞团队复刻DeepSeek,真相竟是基于阿里通义千问模型!

84 1

人工智能领域再掀波澜:低成本AI推理模型s1横空出世 一、低成本AI模型s1引发业界热议 近日,一则关于人工智能领域的新闻引起了广泛关注。据悉,斯坦福大学和华盛顿大学的研究人员李飞飞等人,仅花费不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。这一模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。 二、s1模型背后的秘密:基于阿里云通义千问模型微调 经过《科创板日报》记者的调查和采访,业内人士透露,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的低成本优势,实际上建立在已具备强大能力的开源基础模型之上。 三、1000个样本数据,s1模型的“神奇”之处 根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。s1模型却以惊人的表现,证明了其强大的推理能力。 四、专家解读:s1模型的神奇源于通义千问模型 青年AI科学家、上海交通大学人工智能学院谢伟迪副教授在接受采访时表示,s1模型的神奇之处在于其基于通义千问模型进行微调。这1000个样本数据在训练中的作用更像是“锦上添花”,而非“从零开始”。 “以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。能力真正神奇的是Qwen模型,而不是s1。” 谢伟迪说。 五、总结 s1模型的横空出世,无疑为人工智能领域带来了新的启示。低成本、高效的AI模型,有望在未来为更多领域带来变革。而s1模型背后的通义千问模型,也成为了业界关注的焦点。

正式上线!在魔兽世界直面先知萨拉塔斯,开启至暗之夜冒险

咒语旅团1.0正式版定档4月 即将全平台登陆

马拉松发售即火 Steam同时在线破8.6万 引玩家瞩目

想玩肉鹅风格赛博骰子策略?骰子骇客1999正式上线

《马拉松赛车:世界》更新发布 新规则玩法登场

《和平精英》新春短剧《想去你的2026》全网播放量超3亿! 游戏DAU 破9000万后再创佳绩

《鸣潮》新共鸣者实机演示 大雷御姐和粉毛少女

《幻兽帕鲁》校园恋爱模拟游戏 特别视频正式公开

玩家耗时55小时 打通《生化危机》系列27部作品

全新上线!莫纳里车站重塑心理视觉恐怖冒险体验

银河破裂者大型更新已上线 海量新内容等你探索

鬼泣+星际战甲元素融合?育碧新作异变金属曝光

Eidos蒙特利尔大裁员,漫威银河护卫队玩家忧后续?

自由篮球春日福利,免费建人气角色 多款宝珠服饰上新!

4月23日开启!体验拾光旅人房车旅行生活模拟乐趣

评论列表
  1. AI新奇迹,李飞团队再现神作!基于通义千问模型超值复刻DeepSeek,体验惊艳又实惠!