← 返回团队 团队 GUI Agent 移动端与桌面端 GUI 自动化屏幕理解与动作定位主动、个性的数字助理 GUI Agent 负责推动屏幕理解、动作定位与真实界面执行闭环,使多模态 Agent 能稳定地操作手机与桌面应用。 研究方向 基于 LLM 与 VLM 的 GUI 交互智能体 面向真实任务的执行稳定性与错误恢复