登顶全球最强开源模型：阿里宣布开源Qwen3

Aim_yuan 发表于 4 시간전

108 0 0

　　4月29日凌晨，阿里巴巴（BABA/09988）宣布，新一代通义千问大模型Qwen3正式发布并全部开源8款混合推理模型。

　　该模型采用国内首创的混合推理架构，参数量仅为DeepSeek-R1的1/3，成本大幅下降，在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型，登顶全球最强开源大模型榜单。
　　Qwen3采用混合专家架构（MoE），总参数量235B，激活参数仅22B，其“快思考”与“慢思考”模式可根据需求动态分配算力，如秒级响应简单问题，多步骤处理复杂任务，显著降低推理成本。在数学（AIME25 81.5分）、代码（LiveCodeBench 70+分）、人类偏好对齐（ArenaHard 95.6分）等评测中，Qwen3均刷新纪录，部分指标甚至超越Grok3和OpenAI-o1。
　　阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型，其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能，32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置，适配手机（4B）、汽车（8B）、企业级（32B）等场景。结合Qwen-Agent框架及MCP（模型上下文）协议，开发者可低代码调用工具功能，加速智能体（AI Agent）应用落地。
　　据阿里2024年财报，截至2024年12月31日止9个月，云业务收入同比增长9%至879亿元，AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力，推动其“模型即服务”（MaaS）生态扩张。
　　目前，通义系列模型全球下载量超3亿次，衍生模型超10万，已超越美国Llama成为全球第一开源模型。

浏览过的版块