关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3430人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

年仅46岁!“量子通信第一股”董事长在办公室去世,5月才上任

财通社 浏览 2837

曲刚:要付出最大努力来打好比赛,罗德里格伤势已没问题

懂球帝 浏览 3469

腾讯 AI 实现肺癌基因突变预测,精度最高 99%

IT之家 浏览 3569

美媒:马杜罗政权过渡或不会像特朗普希望的那样顺利

澎湃新闻 浏览 9657

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 2282

波兰逆转首夺联合杯,本西奇送蛋丝袜仍难救主,瓦林卡被批拖油瓶

网球之家 浏览 2561

杭州女子洗完澡一抬头 发现窗外停着一架无人机

极目新闻 浏览 3558

ED网红病,正在掏空年轻女性

她刊 浏览 788

纯度更高的致敬 尚界Z7预告图发布

网易汽车 浏览 2439

黎以停火协议生效一年 以军称打死370余名武装人员

国际在线 浏览 2937

三星被曝2026年发新款折叠屏手机,屏幕超7英寸、护照式设计,叫板苹果

智东西 浏览 2801

OpenAI ChatGPT自动切换严格模型处理情感话题,用户却不知情

IT之家 浏览 4237

马斯克最担心的事情来了,阿里投资了核电站!

花朵财经 浏览 2352

NBA战报:凯尔特人115-101公牛取NBA4连胜,安芬尼-西蒙斯27+3+3

懂球帝 浏览 2481

“一言不发”的唐嫣,给娱乐圈上了一课

李橑在北漂 浏览 2322

全运会25米速射团体赛:奥运冠军李越宏领衔,山东险胜陕西夺金

全景体育V 浏览 3572

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 2825

恩里克:踢出极高的水平是我们一贯的目标;要避免球员受伤

懂球帝 浏览 3397

红魔授权服务中心・售后网点最新进展公布,覆盖全国62城

IT之家 浏览 2944

意大利比萨大学:让AI神经网络高效处理信息的新技术ParalESN

科技行者 浏览 2243

美军称在东太平洋打击一“贩毒船” 致4人死亡

极目新闻 浏览 2830
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1