关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3098人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

荷兰政府对闻泰科技安世半导体下手 中资股权仅剩1股

蓝鲸新闻 浏览 3145

太阳报:曼联预计未来几周官宣前往沙特踢季中赛

懂球帝 浏览 2873

哪些措施能有效阻止美国充当"世界治安官" 外交部回应

环球网资讯 浏览 8154

全国巡回上坟的大学生,追星追到阴间了

她刊 浏览 361

小米穿越风暴这一年,给创新者以时间

中国企业家杂志 浏览 2080

女网红名下公司涉嫌逃税逾千万被查处 仍在高频次直播

红星新闻 浏览 7403

疑一则广告惹祸 特朗普宣布终止与加拿大所有贸易谈判

财联社 浏览 8983

中国汽车出海,插混和增程将是巨大的“机会点”

汽车公社 浏览 2201

专家:高市早苗跟台湾关系较密切 会让大陆比较担忧

澎湃新闻 浏览 6222

聊聊全新奥迪A6L 也许豪华行政市场要换风向了

网易汽车 浏览 3343

一家4口爬山妻子坠亡 警方排除他杀可能:属于高空坠亡

极目新闻 浏览 41242

小鹏机器人首秀摔了 此前因步态太拟真被疑"真人套壳"

澎湃新闻 浏览 7916

消息称LPDDR5X内存价格持续飙升,涨幅可抵2亿像素潜望镜

IT之家 浏览 3098

50多名女性被"完美老公"骗数千万 女子:还发生了关系

新京报 浏览 8117

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 2100

小米成都车祸引解锁争议 打不开的电动车门成监管焦点

界面新闻 浏览 7491

美航母大火持续超30小时后被扑灭 600多人无床可睡

环球网资讯 浏览 124435

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

静儿时尚达人 浏览 2135

恩里克:我们在23分钟内丢了3个球?那是对手球员的实力所致

懂球帝 浏览 3189

走过那个夏天,甜茶终于站上金球奖之巅

时尚COSMO 浏览 1663

书记戴的AI眼镜全网刷屏!今年东博会这个含量“爆表”

国是直通车 浏览 3775
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1