Qwen3.7预览版上线,数学编程多模态能力大幅提升
人工智能大模型领域的更新步伐正在加速。阿里巴巴旗下的通义千问系列迎来重要迭代,其两款预览模型——Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview,已正式登陆 Qwen Chat 及 Arena AI 平台,预示着其即将迎来正式发布。
此次推出的预览模型定位明确:Qwen3.7-Max-Preview 是一款旗舰级的“大脑”预览版本,旨在挑战综合性能的上限。目前,该模型主要开放了其思考能力,诸如搜索和代码解释器等工具性功能尚待后续解锁。而 Qwen3.7-Plus-Preview 则定位于高性能均衡版本,同样侧重于推理与逻辑表达能力,其完整的工具链支持也将在稍后开放。

尽管仍处于预览阶段,这两款新模型已在实际测试中展现出不俗的表现,引发了业界的广泛关注。在 Arena AI 的文本能力排行榜上,Qwen3.7-Max-Preview 凭借其强大的综合实力,位列第13名,这也使得阿里巴巴通义千问系列在全球同类实验室中攀升至第六位。在具体的细分领域,该模型尤为突出,在数学推理、专家级应用、软件与 IT 领域以及编程能力方面均进入前十,展现了其在多任务泛化上的深厚实力。
在视觉能力方面,Qwen3.7-Plus-Preview 取得了综合排名第16位的成绩,为通义千问系列在视觉能力榜单上赢得了第五名的位置。此外,在仅针对专家级提示词的“专家竞技场”中,Qwen3.7-Max-Preview 同样取得了第九名的优异成绩,这表明其在高难度、高精度任务下的稳定性正迅速逼近行业第一梯队。
对于开发者和深度用户而言,此次预览版的上线不仅提供了一个提前体验下一代模型强大能力的窗口,更传递了一个清晰的信号:阿里云正通过“小步快跑、快速迭代”的策略,在大模型军备竞赛的关键节点上持续巩固其战略地位。
Qwen3.7系列预览模型的出现,标志着大型语言模型在性能和能力上又迈出了重要一步。其在多模态理解、复杂推理以及专业领域应用上的显著提升,预示着未来AI将能更深入地融入科研、开发以及日常生活的各个层面,为用户提供更智能、更便捷的服务。