4月3日,全球知名的大模型盲测榜单LMArena旗下的Code Arena公布了最新一期的编程能力排名。在此次评测中,阿里巴巴的大语言模型Qwen 3.6-Plus表现突出,凭借强大的代码生成与理解能力,位列全球第二。这一成绩不仅使其成为中国所有参评大模型中排名最高的选手,也再次证明了中国在人工智能底层技术领域的快速进步与竞争力。
Code Arena榜单以盲测和侧重真实编程任务著称,其评估维度涵盖算法设计、代码准确性及复杂问题解决效率,因此被业内视为衡量大模型编程能力的权威标尺之一。Qwen 3.6-Plus能够在与全球顶尖模型的激烈角逐中跻身前列,反映了其在代码逻辑推理和结构化输出方面的显著优势。
此次排名也是阿里通义千问系列持续迭代的最新成果。此前,Qwen系列在多个国际基准测试中已屡获佳绩。随着大模型在软件开发、自动化编程等场景的深入应用,中国模型在这一核心能力上的突破,正为全球开发者生态提供更丰富的选择,同时也为国内AI技术从追赶迈向引领注入强劲动力。