关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者4201人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 4240

委内瑞拉代总统:我“受够了”来自华盛顿的命令

扬子晚报 浏览 7603

时间序列也会"说话"?这个突破性AI让数据图表变成了智能分析师

科技行者 浏览 3467

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

新民周刊 浏览 7597

华为nova 15 Ultra / Pro支持自研Wi-Fi 7+芯片级协同技术

IT之家 浏览 3448

美国欲“夺岛”,俄罗斯正“吞地”,中国应做什么?

浏览 27318

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 4184

26款奔驰S级入门版不足90万起!外观豪华大气,搭载2.5T+48伏轻混

小史谈车 浏览 3175

缅甸政府军突袭KK园区 查获30套星链设备

红星新闻 浏览 9450

郑晓龙监制!杨紫主演耗资3.5亿的史诗级传奇剧

娱乐圈笔娱君 浏览 2420

92岁陶玉玲去世,身患3癌丧女又丧夫

疯说时尚 浏览 3189

匹克被指要求拒绝降薪员工写检讨否则就停薪 当地回应

上游新闻 浏览 9531

支持家乡球队,网球球员吴易昺来黄龙体育场观战浙江vs山东

懂球帝 浏览 4247

爱优腾芒长剧阵地战

海克财经 浏览 3017

都体:加拉塔萨雷对弗拉泰西开始犹豫,认为他防守属性不够强

懂球帝 浏览 3307

和任正非聊一聊,会有新品牌?

道哥说车 浏览 4397

印尼国家队经理:克鲁伊维特教练团队必须重新接受评估

懂球帝 浏览 4383

面见查尔斯后,哈里夫妇首度合体亮相

草莓解说体育 浏览 4905

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 3062

女友BELLA+封面 | SUPER JUNIOR-D&E 双子星的友情叙事诗

伊周潮流 浏览 6209

圣桐特医再度递表 财务紧绷难解

北京商报 浏览 3509
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1