智谱 AI 发布首款多模态编程基础模型 GLM-5V-Turbo,支持原生视觉编码与 Agent 协同

智谱 AI(Z.ai)昨日发布首款多模态编程基础模型 GLM-5V-Turbo,原生支持图像、视频、文本等多模态输入,专注视觉编码任务,可完成“理解环境—规划动作—执行任务”的完整 Agent 闭环。该模型针对 Claude Code、OpenClaw 等 Agent 深度优化,支持 GUI 自主探索、代码调试、网页复现等复杂任务,并扩展了画框、截图、读网页(含图片识别)等多模态工具链。同期升级的还有 GLM-4-Air/Flash 基座模型、GLM-Z1 系列推理模型及支持多引擎切换的 AI 搜索工具。