凤凰网科技讯 6月2日,今日凌晨 ,通义实验室正式发布Qwen3.7-Plus多模态智能体模型。该模型在Qwen3.7文本与Agent能力基础上深度融合视觉能力,主打“能看 、能想、能动手”――可看懂图形界面、操作应用 、生成代码并交付结果,实现GUI操作、CLI调用、代码生成与自我验证的端到端闭环 。

在实测中 ,基于Qwen3.7-Plus构建的Hybrid-Agent系统连续稳定运行11小时以上,自主完成一款英语单词学习APP的完整研发闭环:累计生成超10000行代码,触发超1000次调用 ,覆盖需求文档生成 、代码编写、自动部署、测试用例创建、GUI自动化测试及版本迭代全流程。
在桌面应用场景中,该模型可自主交互macOS原生Stocks应用并理解UI布局与功能细节,自动生成SwiftUI源码,接入LongBridge真实行情API获取实时数据 ,自动编译构建并启动复刻应用。随后自主执行10项功能验证测试并全部通过,最终完整复现原生Stocks应用的暗色主题 、分栏布局与实时行情交互体验 。
此外,Qwen3.7-Plus还支持多模态推理(可解析地铁线路图等复杂视觉信息)、搜索增强视觉问答、图像/视频转SVG矢量代码 、视觉驱动的网页设计等功能 ,并在浏览器Agent场景中可自动完成ECS云服务器采购、运维链路闭环等任务。模型在BabyVision、MathVision 、ScreenSpot Pro、AndroidWorld等多项高难度基准上表现强劲。目前Qwen3.7-Plus已在阿里云百炼平台上线,支持OpenAI兼容API与Anthropic协议调用 。








