阿里云通义千问团队发布Qwen3.7-Plus多模态Agent模型 全球榜单表现亮眼

   发布时间:2026-06-02 15:08 作者:孙明

阿里云通义千问团队近日宣布推出Qwen3.7-Plus多模态智能体模型,该模型通过整合视觉与语言处理能力,构建了统一化的智能基座。这一突破性进展标志着人工智能技术向多模态交互领域迈出重要一步,为复杂场景下的智能应用提供了更高效的解决方案。

在技术架构层面,Qwen3.7-Plus在原有文本处理与智能体功能基础上,深度融合了视觉认知模块。新模型支持图像、视频、屏幕截图及网页内容等多种视觉输入形式,并能在图形用户界面(GUI)和命令行界面(CLI)环境中自主执行任务。根据全球权威视觉大模型评测平台Vision Arena最新数据,该模型在综合性能排名中位列全球前五,同时摘得中国区榜首桂冠。

实际应用测试中,基于Qwen3.7-Plus构建的Hybrid-Agent系统展现出强大能力。该系统在持续11小时的稳定运行期间,自主完成了英语单词学习类应用程序的全流程开发,涵盖需求分析、界面设计到功能实现等完整环节。更令人瞩目的是,系统成功复刻了macOS系统原生Stocks应用的视觉效果与交互逻辑,实现像素级还原度,验证了多模态智能体在复杂软件开发场景中的可行性。

需要特别说明的是,本报道所涉及的技术参数与应用案例均基于公开信息整理,相关数据及结论不构成任何形式的投资参考。读者在应用相关技术时,建议通过官方渠道获取最新信息并进行独立验证。

 
 
更多>同类内容
全站最新
热门内容
本栏最新