阿里千问没完了!Qwen3.6-27B又来,开源且击败大15倍的前代模型
阿里千问又发模型了。Qwen3.6-35B-A3BQwen3.6-PlusQwen3.6-Max-Preview现在是 Qwen3.6-27B源神这模型没完没了地发。仅仅拥有270亿参数的开源新星在复杂的代码基准测试中击败了总参数量高达其15倍的前代旗舰模型。27B 稠密模型是社区呼声最高的模型它摒弃了复杂的路由架构以全参数计算的形态在多模态理解与智能体编程领域交出了一份优秀的答卷。开发者们本地模型又该换了。纯粹架构开发者在实际应用中经常面临算力分配与部署环境的限制。体量巨大的模型固然强大运转起来却需要极高的显存带宽与复杂的工程调度。Qwen3.6-27B 采用 Dense稠密模型架构。270亿个参数在每一次计算中都会全员参与运算。不需要像 MoE混合专家模型那样进行路由分配计算开发者可以直接将其部署在常规的硬件集群上大幅降低了工程落地的门槛。模型原生具备处理图像、视频与文本的能力。系统内部支持视觉语言的思考模式与非思考模式平滑切换。面对现实应用中的各类复杂场景无论是细致的视觉推理任务还是繁杂的文档理解工作抑或是常规的视觉问答系统都能轻松应对。开发者获得的是一个能力全面且容易部署的实用工具。编写代码并解决实际软件工程问题是检验大语言模型逻辑思考能力的试金石。Qwen3.6-27B 在 Agent智能体编程能力上实现了跨级别的超越。对比对象是前代开源旗舰 Qwen3.5-397B-A17B一个总参数3970亿、激活参数170亿的大型模型。270亿参数的小巧体型在所有主流编程基准测试中全面反超。与比它大15倍的前代 397B 的混合专家模型相比在代表真实世界软件工程问题解决能力的 SWE-bench Verified 测试中Qwen3.6-27B 拿到了77.2分超越前代的76.2分。在难度更高的 SWE-bench Pro 测试里它以53.5分胜出前代的50.9分。Terminal-Bench 2.0 测试中拿下了59.3分。SkillsBench 更是以48.2分对30.0分取得了显著领先。在检验研究生级别科学推理能力的 GPQA Diamond 测试中它斩获了87.8分表现完全看齐数倍于自身体量的基准模型。与谷歌刚刚开源的Gemma4-31B相比全方位领先。多模态数据透视千问团队为研发体系注入了扎实的多模态基因。从基础的自然语言处理到复杂的长序列视频理解模型在评测基准中展现出了非常均衡的综合素质。在科学技术工程数学与解谜、通用视觉问答、文档理解以及空间智能等核心板块270亿参数版本的数据均保持在高位水平。与同等规模的其他开源稠密模型横向对比它在多数细分指标上确立了明显的领先身位为需要多任务处理能力的开发者提供了可靠的底座支持。从开源的 Qwen3.6-35B-A3BQwen3.6-27B到闭源的 Qwen3.6-PlusQwen3.6-Max-PreviewQwen3.6 家族在智能体编程能力上完成了集体跃升。27B 版本精准填补了实用级规模下本地顶尖编程能力的空白。赶紧本地跑起这个聪明的代码新搭档。参考资料https://qwen.ai/blog?idqwen3.6-27b