关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3426人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马自达EZ-6官降2万!起售价低至11.98万元

车评网 浏览 3320

涉嫌支持台军心战大队 5家企业主营业务被曝光

日月谭天 浏览 7719

特朗普:加沙"和平委员会"已成立

新京报 浏览 2431

英伟达发布新一代Rubin平台,推理成本较Blackwell降10倍,拟下半年发货

华尔街见闻官方 浏览 2589

还有反转?上周五“精准做空”引发全市场关注,神秘交易员再度开出1.6亿美元空单

华尔街见闻官方 浏览 3673

普京否认"俄计划攻击北约" 喊话西方国家:睡个好觉

环球网资讯 浏览 3558

被瑞幸冲击,星巴克撑不下去了……

功夫财经 浏览 3219

江汽集团董事长项兴初拜访华为任正非,进一步拓宽合作领域

财闻 浏览 2698

世体:对阵贝蒂斯卢克曼将直接首发,完成加盟马竞后的首秀

懂球帝 浏览 2155

陈水扁屡踩红线后终于"踢铁板" 被指与赖清德关系生变

海峡导报社 浏览 9808

车崇健被嘉宾集体吐槽!Papi直言他听不懂人话,网友喊话别复合了

萌神木木 浏览 3291

E句话| 李艺彤和丝芭居然和平解约了?

仙女事件簿 浏览 2178

秋季穿衣别太复杂,提前准备好这几件单品,百搭经典又不挑人

静儿时尚达人 浏览 3632

王健林交棒!万达电影更名,80后湖北富豪接盘

今古深日报 浏览 220

马斯克宣布X Money四月公测

财闻 浏览 1547

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 3176

明年上半年上市 奇瑞风云实车A9 EV亮相

车质网 浏览 3067

OPPO Enco R5无线耳机现身中国电信终端产品库

IT之家 浏览 914

中国买家为希腊黄金签证花25万欧买房 如今2万欧卖出

红星新闻 浏览 7889

马斯克承认其他车企不想获得特斯拉FSD授权:他们简直疯了

IT之家 浏览 3050

谷歌AI实现类人判断解决系统偏见问题

科技行者 浏览 3349
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1