![]()
这项由北卡罗来纳大学教堂山分校、普渡大学和微软联合开展的研究,于2025年11月发表于arXiv预印本平台(论文编号:arXiv:2511.06101v1),有兴趣深入了解的读者可通过该编号查询完整论文。研究团队成员包括来自UNC的王兆阳、韩思伟和姚华秀教授,普渡大学的梁艺明,以及微软的张旭超、吴千惠等多位专家。
想象一下,你有一个非常聪明的助手,他在熟悉的超市里能轻松帮你找到任何商品,但一到陌生的商场就完全不知所措,连洗手间都找不到。这正是当前AI网页助手面临的尴尬处境。这些被称为"网页代理"的AI助手,虽然在训练时见过的网站上表现出色,但一遇到全新的网站就束手无策,仿佛突然失去了所有技能。
这个问题的根源在于,训练这些AI助手需要大量特定网站的任务示例和操作轨迹,就像需要详细的地图和导航指南一样。然而,为每个新网站收集这样的训练数据不仅耗时费力,而且成本高昂。更糟糕的是,即使想要人工合成这些训练数据,现有的方法也存在严重问题:要么生成的任务根本无法执行(就像给出错误的地址),要么收集的操作步骤充满了冗余和错误(就像绕了很多弯路才到达目的地)。
面对这一挑战