关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者2739人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

台媒:解放军演习戳破“美日救台”迷梦

参考消息 浏览 16258

小米SU7高速碰撞后起火 事发前速度或超200km/h

网易汽车 浏览 2829

再见美拉德,今年流行的“新高智风”时髦又高级!

LinkFashion 浏览 2678

上新|| 秋冬也可以穿的漂亮小裙子,美到心动

黎贝卡的异想世界 浏览 2458

兰州临街商铺突发爆炸致一死 事发路段已封锁仍在排查

大风新闻 浏览 2819

这一天,35岁李沁秒了28岁陈哲远,才知李少红当年的眼光有多绝

温柔娱公子 浏览 2844

特朗普"力挺"中国 高市闯祸能否拥有核武日本说了不算

空天力量 浏览 39850

郭德纲相声春晚访谈,透露最新计划

杨仔述 浏览 1695

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 18890

引援自救!内蒙古矿业富豪入局,贾国龙朋友圈托举西贝

时代财经 浏览 615

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 2906

市场关键时点前夕,伦敦金属交易所交易一度中断两小时,铝锌等金属受影响

华尔街见闻官方 浏览 592

特朗普与高市早苗首次会晤 外交部回应

政知新媒体 浏览 14724

伊姐周日热推:电视剧《御赐小仵作2》;电视剧《偶像疯子》......

伊周潮流 浏览 1443

伊姐周六热推:电视剧《不眠日》;电视剧《照镜辞》......

伊周潮流 浏览 4595

我用1秒成为陈妍希梦女,你也来试试吧

时尚COSMO 浏览 2102

萨里:我们没给罗马太多机会,但随后自己阵脚大乱

直播吧 浏览 3549

比亚迪秦家族新款7.98万起售!爆胎稳定系统上车,综合续航超2000km

车东西 浏览 1712

这个APEC城市的金融巨无霸,正撕下“老登”标签

博闻财经 浏览 2574

东风集团股份资本重组方案落地 实现100%国有控股

网易汽车 浏览 757

地区战争风险加剧 哥伦比亚总统重批美国“侵略拉美”

环球网资讯 浏览 2883
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1