关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2651人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国家放大招了,一口气画了10个圈!

米筐投资 浏览 3001

郝蕾澄清亲口澄清:压根不是说她

ETtoday星光云 浏览 2168

天猫服饰10月刊:趋势解码·上新日历 | CBNData报告

第一财经商业数据中心 浏览 2752

钉钉推出全新AI原生工作平台“悟空”

IT之家 浏览 589

A股年内近160股易主

北京商报 浏览 2248

律师谈吃娃娃菜中毒夫妻被抓:最高判刑十年以上

大象新闻 浏览 3738

视帝扛起大旗,终于有90后当主角的年代剧了

娱乐圈笔娱君 浏览 1496

储能内卷的标准样本:黑马果下科技,究竟是如何速成的?

赶碳号 浏览 1713

美媒公布美军打击委内瑞拉蒂乌纳堡基地后景象

环球网资讯 浏览 1803

澳方称中方军机在南海对澳军机释放干扰弹 外交部回应

澎湃新闻 浏览 2817

“过年红”就这么穿,真不俗!

Yuki女人故事 浏览 1479

多地现快递驿站转让帖 经营者:每月只赚5千不如当保安

红星新闻 浏览 7518

61岁基努里维斯牵52岁女友玩滑冰,现场亲吻

素素娱乐 浏览 1628

对话黑芝麻高管:不烧钱造新芯,机器人平台发布前已经创收

车东西 浏览 2309

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 2855

福建发布人工智能扶持新政:拟对企业年度算力购买最高补助50%

观察者网 浏览 2548

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 2486

肖荣基带肖思远的照片亮相九三阅兵

环球网资讯 浏览 2864

华语乐坛重量级编曲大师屠颖意外去世 儿子发文悼念

鲁中晨报 浏览 7487

俄"默许"朱拉尼相关提案 中国在联合国动用一票否决权

梁讯 浏览 13450

2月销量普跌,三大中国车企仅吉利超20万辆

驾仕派 浏览 948
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1