← 返回首页博客区

博客与论文

这里独立展示我们已经发布的博客、论文解读与技术文章,按日期倒序浏览,不再占用首页滚动区域。

共 12 篇内容 按发布日期倒序展示

论文 arXiv'26 Adaptive Milestone Reward for GUI Agents

日期:2026/02/11 作者:Congmin Zheng, Xiaoyun Mo, Xinbei Ma, et al.
通过可验证、可演化的 milestone 奖励和非对称 credit assignment,缓解长程 GUI 强化学习中的时序 credit assignment 问题
阅读文章