← 返回团队
GUI Agent
团队

GUI Agent

移动端与桌面端 GUI 自动化屏幕理解与动作定位主动、个性的数字助理

GUI Agent 负责推动屏幕理解、动作定位与真实界面执行闭环,使多模态 Agent 能稳定地操作手机与桌面应用。

研究方向

  • 基于 LLM 与 VLM 的 GUI 交互智能体
  • 面向真实任务的执行稳定性与错误恢复