关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者4292人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外观酷似G级 奔驰全新纯电SUV谍照曝光

车质网 浏览 3079

全球第一大女主,让内娱彻底红了眼

独立鱼 浏览 3277

柬埔寨提高获取公民身份投资门槛:至少需100万美元

红星新闻 浏览 20753

美媒破大防:越南假想美国入侵 却不忌惮中国

澎湃新闻 浏览 5206

美国务卿批准向中东国家出售价值258亿美元的武器

国际在线 浏览 985

江淮受累于大众安徽亏损,受惠于尊界S800热销

道哥说车 浏览 3244

张国强:被前妻嫌穷,如今苦尽甘来

小娱乐悠悠 浏览 4917

欧洲高颜值王室访华:曾与高中老师结婚 二婚嫁入王室

上游新闻 浏览 36175

拉莫斯:虽然浙江队实力很强,但我们最近的火力也很强盛

懂球帝 浏览 4187

婚变传闻真相大白一个月,唐嫣高调官宣喜讯

叨唠 浏览 2748

唐嫣客串新剧遭群嘲!戴假发被吐槽像女装大佬,疑和马思纯抢番位

萌神木木 浏览 3510

博纳老板于冬被澳门赌场追债400多万

严肃八卦 浏览 2457

韩星张元英辱华发酵!相关代言遭抵制品牌方回应,本人持续装糊涂

萌神木木 浏览 2759

马伊琍新年第一天晒全家福!和大女儿合影好温馨

隔壁灵妹妹 浏览 3421

这俩人原来是夫妻,因拍《红楼梦》结缘

素衣读史 浏览 3524

90%的名酒在跌价,2026年酒企怎么活?

首席商业评论 浏览 3287

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 4125

工程师崩溃!某车企研发开始试行“两班倒”!

明镜pro 浏览 4304

年轻人迷上在线下交换自制周边

钛媒体APP 浏览 4336

谭松韵扛剧能力被质疑 赵丽颖成女主?

楚楚号 浏览 3482

踹开争议男友,她成了最大赢家?

八卦三缺一 浏览 3258
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1