关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者111人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黄晓明新片差评如潮,主演电影连扑三部,票房号召力越来越差了

萌神木木 浏览 188

9岁乔治小王子看板球吃披萨好胃口,穿西装被热议

译言 浏览 14788

中国拿出比稀土更致命的王牌美国"破防" 万斯:要冷静

时时有聊 浏览 4421

售17.98万起 方程豹钛7首周上险量为1257台

网易汽车 浏览 999

理想L6预告图曝光!定位5座SUV,售价有望下探至25万元

汽车网评 浏览 12056

莫科:命中18记三分是赢球根本 阿的江指导战术多变

直播吧 浏览 18364

传中芯国际获美供应商供应许可,主要涵盖成熟工艺

爱集微 浏览 25715

专家:敏感时刻俄核演习展示肌肉 发出强烈威慑信号

澎湃新闻 浏览 238

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

都市快报橙柿互动 浏览 10966

营收147亿的半导体资产遭冻结 闻泰科技:坚决反对

21世纪经济报道 浏览 458

知名"富二代"所创明星机器人公司突解散 研发阵容豪华

每日经济新闻 浏览 3921

侯友宜“重启核电”主张掀热议,台媒:其全套能源政见对准经济选民

环球网资讯 浏览 13913

《琅琊榜3》能否继续,孔笙表示剧本还在改,怕是“有生之年”了

最爱酷影视 浏览 10585

羽绒服+裤子才是冬天的最佳组合,百搭不挑人

八只爪的猫 浏览 12558

日本考虑年内制定AI使用规则,或采取比欧盟更柔和立场

界面新闻 浏览 14558

前淄博队员再讨薪:欠薪至今未发,华昆方面不愿沟通

趣看热点 浏览 25017

瑞银和瑞信合并后将是什么样?

第一财经资讯 浏览 18038

张慧贤指责万鹏“当小三当惯了”万鹏方严正声明

韩小娱 浏览 378

马斯克也招“天才少年”!年仅14岁,担任SpaceX软件工程师,录取率仅为0.2%

每日经济新闻 浏览 15876

住建部部长赶赴吉林,调研灾后农房恢复重建工作

澎湃新闻 浏览 13978

年过40岁的女人,过年的时候这么穿,亲戚朋友见了都夸赞不已

静儿时尚达人 浏览 12593
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1