阿里巴巴(09988)发布Qwen3.6-Max预览版

ppying 4 2026-04-21 07:56:03

智通财经APP获悉 ,继Qwen3.6-Plus发布之后 ,阿里巴巴(09988)千问大模型团队分享下一代旗舰模型的早期预览版:Qwen3.6-Max-Preview相比Qwen3.6-Plus,本次预览版带来了更强的世界知识和指令遵循能力,以及在多项基准上显著提升的智能体编程表现。作为预览版 ,模型仍在积极迭代中,后续版本将持续优化 。Qwen3.6-Max-Preview主要特性包括:相比Qwen3.6-Plus显著提升的智能体编程能力;更强的世界知识和指令遵循;更优的真实场景智能体与知识可靠性表现 。

阿里巴巴(09988)发布Qwen3.6-Max预览版-第1张图片

模型性能

以下展示了 Qwen3.6-Max-Preview 与主流前沿模型的评测对比。相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升(如 SkillsBench +9.9、SciCode +10.8 、NL2Repo +5.0 、Terminal-Bench 2.0 +3.8) ,世界知识更强(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更优(ToolcallFormatIFBench +2.8)。在权威三方评测Artificial Analysis刚刚更新的大模型榜单中,Qwen3.6-Max-Preview性能表现超过GLM5.1、MiniMax-M2.7等模型 ,登顶最佳国产模型 。

阿里巴巴(09988)发布Qwen3.6-Max预览版-第2张图片

开始使用Qwen3.6-Max-Preview

Qwen3.6-Max-Preview将通过阿里云百炼 API 提供,模型名称为 qwen3.6-max-preview。您也可以在 Qwen Studio 上即时体验。

API更新

阿里云百炼支持行业标准协议,兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API ,以及兼容 Anthropic 的 API 接口 。

本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。

总结

Qwen3.6-Max-Preview 是千问大模型下一代旗舰模型的早期预览版,在智能体编程 、世界知识和指令遵循方面相比 Qwen3.6-Plus 均有显著提升。它在六项主要编程基准上取得最高分――SWE-bench Pro、Terminal-Bench 2.0、SkillsBench 、QwenClawBench、QwenWebBench 和 SciCode――相比前代有大幅进步 。同时在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。

作为预览版 ,Qwen3.6-Max-Preview仍在积极开发中。千问大模型团队将持续迭代模型 ,后续版本将带来进一步提升 。

目前,千问3.6系列已推出Qwen3.6-Max-Preview 、Qwen3.6-Plus、Qwen3.6-Flash,并开源Qwen3.6-35B-A3B。其中 ,Qwen3.6-Plus登顶全球最大的三方API调用平台OpenRouter的日榜、周榜 、趋势榜冠军,Qwen3.6-35B-A3B则登顶HuggingFace全球开源大模型榜单冠军,千问3.6成为当下最受企业和开发者欢迎的大模型。

上一篇:【31省份新增本土确诊39例浙江16例,浙江省份新增本土病例】
下一篇:旅游业不断的发展(旅游业发展的规律)
相关文章