关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者2734人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄军连续45天被机枪火力压制 乌军"秘密武器"被披露

环球网资讯 浏览 1604

美媒:大批美军机突然飞往欧洲

环球时报国际 浏览 1742

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 1754

冬天别只穿厚重的羽绒服,看看这些大衣穿搭,高级大方又有质感

静儿时尚达人 浏览 1670

美联储“独立性”面临挑战,华尔街想确定“是敌是友”,美联储新主席提名引发市场猜测

环球网资讯 浏览 1447

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 2038

美2027财年国防预算恐创纪录 五角大楼查女兵"有效性"

红星新闻 浏览 12432

赵文卓夫妇送女儿上学,18岁赵子仪卷出高水准

凌风的世界观 浏览 2006

50+女人别踩坑!远离紧身裤和老年装,这样穿优雅又显瘦

静儿时尚达人 浏览 2178

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 2704

以军空袭黎巴嫩南部轰炸真主党重型机械 画面披露

环球网资讯 浏览 2888

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 2704

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 1394

加公有能!罗马5轮4胜仅失1球升第2

体坛周报 浏览 3268

或于2026年推出 比亚迪大汉谍照曝光

车质网 浏览 2024

苹果iOS、谷歌 Android 系统将面临英国更严格反垄断审查

IT之家 浏览 2732

国盛投资受让1.07亿股股权 复旦微电大股东拟变更

证券时报 浏览 2407

解码基金“擒牛术”!从同花顺到新易盛,三波牛市验证三大选股核心逻辑

券商中国 浏览 1850

大二女生回家途中失踪8年:父亲悬赏10万寻女无果

红星新闻 浏览 93842

尼斯和巴黎FC的比赛中看台响起恐同口号,导致比赛中断几分钟

懂球帝 浏览 3376

财经观察:担忧产业短板,欧盟自查“经济瓶颈”

环球网资讯 浏览 2838
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1