阿里巴巴正式发布了全新一代千问旗舰模型Qwen3.7-Max,这一版本被视为阿里在大模型领域技术路线的一次重要升级。与此前的Qwen3.7系列预览版相比,Max版本在综合能力上实现了显著跃升。据第三方评测机构Arena公布的全球大模型盲测总榜显示,Qwen3.7-Max超越了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1等国产主流模型,位列国产模型第一,与GPT、Claude、Gemini等国际顶尖模型的最强版本在得分上已极为接近。这一成绩标志着国产大模型在核心能力上正在缩小与全球第一梯队的差距。
Qwen3.7-Max的定位非常明确——面向当下智能体(Agent)全面优化的模型。随着AI应用从单一的“对话问答”向“自主任务执行”演进,模型不仅要会“说”,还要能“做”。千问3.7在函数调用、多步规划、工具使用、状态记忆等智能体核心能力上进行了专门强化,使其能够更可靠地完成订票、比价、跨应用操作等复杂任务。这意味着开发者可以基于Qwen3.7-Max构建出更自主、更稳定的AI Agent应用,真正将大模型从“聊天机器人”推向“数字执行者”。
除了智能体能力的提升,Qwen3.7-Max在代码编程、数学推理、长文本理解等技术维度上也有明显进步。它在Arena的代码评测中排名靠前,能够更好地辅助开发者完成代码生成、调试和解释工作;在数学逻辑推理上的增强,使其在金融分析、科学计算等专业场景中更具实用性。可以说,千问3.7不再是单纯的通用对话模型,而是一把面向真实任务场景的“多面手”。随着千问3.7的正式推出,阿里在大模型赛道的竞争姿态正从“追赶”转向“并跑”。能否在接下来的Agent应用爆发期占据先机,值得行业持续关注。