첫 페이지 美股新闻 본문
  4月29日凌晨,阿里巴巴(BABA/09988)宣布,新一代通义千问大模型Qwen3正式发布并全部开源8款混合推理模型。

  该模型采用国内首创的混合推理架构,参数量仅为DeepSeek-R1的1/3,成本大幅下降,在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型,登顶全球最强开源大模型榜单。
  Qwen3采用混合专家架构(MoE),总参数量235B,激活参数仅22B,其“快思考”与“慢思考”模式可根据需求动态分配算力,如秒级响应简单问题,多步骤处理复杂任务,显著降低推理成本。在数学(AIME25 81.5分)、代码(LiveCodeBench 70+分)、人类偏好对齐(ArenaHard 95.6分)等评测中,Qwen3均刷新纪录,部分指标甚至超越Grok3和OpenAI-o1。
  阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能,32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置,适配手机(4B)、汽车(8B)、企业级(32B)等场景。结合Qwen-Agent框架及MCP(模型上下文)协议,开发者可低代码调用工具功能,加速智能体(AI Agent)应用落地。
  据阿里2024年财报,截至2024年12月31日止9个月,云业务收入同比增长9%至879亿元,AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力,推动其“模型即服务”(MaaS)生态扩张。
  目前,通义系列模型全球下载量超3亿次,衍生模型超10万,已超越美国Llama成为全球第一开源模型。
您需要登录后才可以回帖 登录 | Sign Up

本版积分规则

Aim_yuan 注册会员
  • Follow

    0

  • Following

    0

  • Articles

    24