(资料图片仅供参考)
人民财讯9月12日电,9月12日,阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。相比于Qwen3的MoE结构,Qwen3-Next架构进行了一系列核心改进,具有更高效的特点。Qwen3-Next-80B-A3B-Base模型拥有800亿参数,激活参数仅30亿,实现了与Qwen3-32B dense模型相近甚至略好的性能,而训练成本仅为十分之一不到,实现了极致的训练和推理性价比。
Copyright @ 2008-2017 www.cjtx.042.cn All Rights Reserved 财经天下周刊网 版权所有 关于我们
联系我们:434 922 62@qq.com京ICP备2023000331号-77