阿里云于2026年6月中旬正式发布通义千问系列最新力作Qwen3.7-Plus多模态智能体大模型。这款模型的推出标志着阿里在AI大模型领域的竞争策略从"参数规模竞赛"转向了"多模态能力深度优化"的新阶段。Qwen3.7-Plus的视觉-语言能力实现了全面升级,在图像理解、视觉推理、代码生成和工具使用等核心维度上都取得了显著进步,多项基准测试成绩超越了GPT-5.5 Turbo。
Qwen3.7-Plus最核心的升级在于视觉-语言跨模态理解能力的跃升。与上一代Qwen3.5相比,新模型在图像描述生成、视觉问答、图表分析和文档理解等任务中的准确率提升了约15%~25%。特别是在OCR文字识别和复杂图表理解方面,Qwen3.7-Plus的表现达到了业界领先水平。在DocVQA文档理解测试中,模型的准确率达到89.6%,在ChartQA图表问答测试中的准确率更是达到了85.3%,两项成绩均超越了GPT-5.5 Turbo。
更值得关注的是Qwen3.7-Plus对多模态推理能力的深度加强。模型不再仅仅是"识别图像中的物体",而是能够理解图像中的复杂场景关系、逻辑顺序和因果关系。例如,在临床医学影像分析场景中,Qwen3.7-Plus可以对X光片中的异常区域进行定位,并基于影像发现生成初步的诊断建议文本。在一项内部测试中,模型对肺部CT影像的异常识别准确率达到92%,与三甲医院主治医师的水平相当。
在视频理解方面,Qwen3.7-Plus能够处理长达10分钟的视频片段,提取其中的关键事件、人物关系和场景变化,并生成结构化的视频摘要。这一能力在视频监控分析、会议记录自动化和教育视频内容索引等场景中具有广泛的应用前景。阿里云表示,下一阶段将进一步提升模型的实时视频理解能力,目标是将视频处理的延迟控制在秒级以内。
Qwen3.7-Plus的另一个重要升级方向是智能体能力。阿里云对模型的基础智能体框架进行了全面重构,使其具备了更强大的工具调用、任务规划和环境交互能力。新模型支持超过200个预置工具和API的自动调用,涵盖搜索、计算、翻译、图像编辑、数据库查询等常用功能。开发者只需通过自然语言描述任务目标,模型即可自动分解任务步骤并调用相应的工具完成执行。
在SWE-bench软件工程基准测试中,Qwen3.7-Plus驱动的AI编程智能体取得了72.4%的问题解决率,较前代模型提升了近20个百分点。这一成绩虽然仍略低于Claude Fable 5的80.3%,但已经在国内大模型中位居第一。阿里云特别在Qwen3.7-Plus中内置了对GitHub Actions、GitLab CI等DevOps工具的调用支持,使其能够在软件开发全流程中发挥作用,从代码编写到测试部署实现AI辅助。
Qwen3.7-Plus还引入了创新性的"多轮纠错"机制。当智能体在执行任务过程中遇到错误或意外情况时,模型能够自动分析失败原因、调整策略方案并重新尝试。这种类似于人类"试错学习"的能力使Qwen3.7-Plus驱动的智能体在实际部署中展现出更高的鲁棒性。阿里云内部测试数据显示,使用多轮纠错机制后,模型在开放式任务中的成功率提升了32%。
阿里云为Qwen3.7-Plus制定了极具竞争力的定价策略。在发布期间,阿里云推出限时八折优惠,Qwen3.7-Plus的API调用价格较GPT-5.5 Turbo低约35%,较GPT-5.6 Terra低约20%。这一价格定位瞄准了GPT-5.6受美国政府限制仅开放有限预览的窗口期,阿里云显然希望抓住这一时机吸引从OpenAI平台转移出来的开发者。
阿里云副总裁在发布会上表示:"Qwen3.7-Plus不仅仅是一个大模型,更是阿里云AI基础设施战略的核心组件。我们将模型的能力与阿里云的算力平台、数据中台和应用生态深度整合,为企业客户提供从模型训练到部署运维的一站式解决方案。"这一表述清晰地体现了阿里云"模型+平台+生态"三位一体的竞争策略,与OpenAI和谷歌的"模型即产品"路线形成了差异化。
Qwen3.7-Plus发布后迅速在企业和开发者群体中获得采用。据阿里云公布的数据,发布首周新增企业客户超过3000家,API调用量突破10亿次。在应用场景方面,智能客服、代码辅助、内容生成和数据分析是最主要的四大使用方向,合计占总调用量的75%以上。已有超过200家ISV独立软件开发商基于Qwen3.7-Plus构建了垂直行业解决方案。
阿里云还宣布了一系列配套生态举措,包括开放Qwen3.7-Plus的模型微调服务、推出开发者激励计划和启动全球合作伙伴招募。这些举措旨在快速扩大Qwen3.7-Plus在开发者和企业客户中的覆盖面,在中国大模型市场中抢夺更多的市场份额。随着GPT-5.6在北美受限和Qwen3.7-Plus的多模态能力突破,国产大模型正在迎来一个难得的发展窗口期。