去年10月份,智谱发布了全球首 个phone use产品 AutoGLM,开启了Agent应用的新时代。今天,智谱再次升级,发布 AutoGLM 2.0。
AutoGLM 2.0 再次将 Agent 提升到新的高度——
• 这是全球首 个手机 Agent
• 国民级 Agent,真正面向普罗大众、人人可用
• 开创 Agent + 云手机的新技术范式,不用抢占用户手机和电脑
• 突破硬件限制,能在任何设备、任何场景下运行,帮助用户Agent代理操作
• 由纯国产模型驱动(GLM-4.5、GLM-4.5V),具备推理、代码与多模态的全能能力
一、执行型助手
过去的 AI 多停留在“对话”层面,只能回答问题;一般的 Agent 助手也多局限于信息查询和总结。AutoGLM 2.0 则实现了质的飞跃——它不再只是“说”,而是真正能够“做”。
事实上,在 AutoGLM 1.0 中,智谱已探索过让 AI 代替用户完成部分手机操作,但只在有限场景下生效。如今,随着 AutoGLM 2.0 的发布,它已经成长为一名 执行型助手,能够在「云端」自主完成多样化的任务。
在生活场景中,用户只需一句话,就能让 AutoGLM 操作抖音、小红书、美团、京东等 40+ 高频应用:点外卖、订机票、查房源、预约健康服务,例如帮你买「秋天的第 一杯奶茶」。
在办公场景中,它同样能跨应用执行全流程工作:从信息检索到内容撰写,再到生成1分钟短视频、PPT 或播客,并直接完成小红书发布。
这意味着,AI 不再是一个“聊天工具”,而是一个能真正替你干活的全能代理人。它不仅能给出答案,还能把任务完整执行,帮助用户节省时间与精力,彻底改变人与 AI 的协作方式。
二、为 AI 配一台手机
AutoGLM 的主要亮点,是一个 APP 让一部手机成为真正的“新物种”。
在 AutoGLM 2.0 中,智谱为 AI 配备了专属云手机和云电脑。Agent 可以在云端自主干活、完成任务,而无需占用用户的本地设备,期间用户可以使用其它APP(如刷抖音、打游戏)。
这意味着它不仅能“自动驾驶手机”,还可异步“代理办公”。让手机真正变成具备自主执行、跨端协作能力的「智能体手机」。
AutoGLM 会以这样的产品形态出现,源于智谱对 AGI 早期形态的理解。智谱认为从 Agent 到 AGI,还需要满足 3A 原则:
• Around-the-clock(全时):24 小时运行,即使用户离线,Agent 依然在执行任务
• Autonomy without interference(自主零干扰):独立运行,不占用用户屏幕与算力,平行世界的搭子
• Affinity(全域连接):跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界
三、新交互,新生态
借助 AutoGLM 强大的 云端执行能力,人与设备的交互方式正在被重新定义。
智谱已将 AutoGLM 的操作执行能力封装为 API,开发者只需简单接入,即可将这一能力无缝融入各类硬件设备。
从 AI 眼镜等可穿戴设备到传统家电,AutoGLM 让它们首次具备完整的 手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。例如,可以直接通过智能眼镜点一杯咖啡。
今日起,AutoGLM 移动端 API 申请通道及 开发者生态共建计划正式上线。除手机与电脑外,手表、眼镜、家电等设备都能成为 Agent 驱动的智能助手。
智谱期待与更多用户和开发者携手,共同探索 AI 融入物理世界的无限可能。
四、技术SOTA
AutoGLM 得以在国内全量上线,因为它是纯国产 Agent,并且成本相较于接入国外模型的 Agent 有了数量级的下降。AutoGLM 由智谱最新开源 SOTA 语言模型 GLM-4.5 与视觉推理模型 GLM-4.5V 驱动。AutoGLM 将基座模型原生能力发挥到*,并结合在「端到端异步强化学习」方面的多项突破成果,得以完成 推理、编码、研究、Agentic 与 GUI 操作等多类任务,并可根据需求灵活调用最合适的「大脑」完成执行。
• ComputerRL:提出 API-GUI 协同范式,提升数据多样性与计算效率;改进 GRPO 并提出 Entropulse 机制,增强探索与策略多样性。
• MobileRL:创新难度自适应强化学习方法(推理自举预热 + 难度自适应 GRPO),显著提升移动端任务的稳定性与收敛效率。
• AgenRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。
在 Device Use 基准测试(涵盖手机、电脑和网页操作)中,AutoGLM 整体表现优于 ChatGPT Agent、UI-TARS-1.5 和 Claude 4 Sonnet,展现出更强的鲁棒性与通用性,已处于主流 Agent 的*水平。