阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

31 1

阿里发布并开源千问3 成本仅需DeepSeek-R1三分之一

千问3:阿里巴巴开源的全新模型,性能超越全球顶尖

近日,阿里巴巴集团宣布开源新一代通义千问模型Qwen3,简称千问3。这款模型在4月29日凌晨正式亮相,以其卓越的性能和成本效益,成为了全球最强的开源模型之一。

千问3的参数量仅为DeepSeek-R1的1/3,这意味着在保持高性能的其成本大幅下降。千问3在性能上全面超越了R1、OpenAI-o1等全球顶尖模型,成为当之无愧的“最强开源模型”。

混合推理模型,快慢思考一网打尽

千问3是国内首个“混合推理模型”,它将“快思考”与“慢思考”集成进同一个模型中。对于简单需求,千问3可以低算力“秒回”答案;而对于复杂问题,它则可以进行多步骤的“深度思考”,大大节省了算力消耗。

这种独特的混合架构使得千问3在处理各种问题时都能表现出色,无论是简单的查询还是复杂的分析,都能迅速给出准确的答案。

全面增强,性能刷新纪录

千问3采用了混合专家(MoE)架构,总参数量为235B,激活仅需22B。其预训练数据量达到了36T,并在后训练阶段进行了多轮强化学习,将非思考模式无缝整合到思考模型中。

在推理、指令遵循、工具调用、多语言能力等方面,千问3都实现了大幅增强。在奥数水平的AIME25测评中,千问3斩获81.5分,刷新了开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破了70分大关,表现甚至超过了Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越了OpenAI-o1及DeepSeek-R1。

成本大幅下降,部署更加便捷

尽管性能大幅提升,千问3的部署成本却大幅下降。仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

这样的成本效益使得千问3更加适合广泛应用于各种场景,无论是企业级应用还是个人用户,都能轻松享受到其带来的便利。

以上就是非法玩家原创的《千问3:阿里巴巴开源的全新模型,性能超越全球顶尖》解析,更多深度好文请持续关注本站。

街头霸王6阿里克斯新角色怎么玩?操作使用指南

踏入新笑傲江湖年度版本,开启策略竞技全新纪元玩法!

宝可梦,Pokopia填30年剧情大坑,全新体验等你解锁

失落星船,马拉松宣传视频,星船生存之旅有哪些震撼体验?

暗黑破坏神4,憎恨之王第二个新职业核心玩法解析

2026年Q2发售!末日生存游戏共渡难关正式公开,等你挑战!

第五人格暹罗厘普联动启动 四荤一素全员入庄园

2026年PC性能优化超棒!死亡搁浅2深度性能分析来袭

生活模拟玩法升级!3.19粒粒的小人国开测,2026游戏必冲之作

烟花之乡浏阳与魔域双向赋能,邀你共赴这场超燃次元盛宴

别错过!3月13日实况足球Online不停服维护重要信息来袭

分手风波后LPL女主持小钰首次更新日常,状态大好心情佳!

主机互动影游情感反诈模拟器,边玩边学反诈知识

S8冠军打野透露改版后没动过野怪,LPL热度为何呈断崖式下跌?

SE心理博弈新游欺杀旅社迎来更新,多项关键调整不容错过!

评论列表
  1. Colonel 回复
    阿里千问3开源还成本低,之前用过大模型都贵,这点真戳我,体验应该更亲民吧~