关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3353人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 3284

中山大学等九校联手突破:AI实现软件bug自动侦测与修复

科技行者 浏览 3242

傅利叶:未来1-2年将脑机接口引入机器人康复训练,提升治疗效率

澎湃新闻 浏览 3115

央视公开“点名”孙俪,原来张艺谋没说错

银河史记 浏览 4056

鲁媒:苏超决赛变成青训对决,别被所谓“草根”赛事蒙蔽双眼

懂球帝 浏览 4306

小鹏汽车11月交付新车36,728台 1-11月累计交付391,937台

网易汽车 浏览 3719

日本开年密集外交搞了不少小动作 引发地区国家警惕

澎湃新闻 浏览 7653

女子代购海外"不老药" 疑遭职业打假人起诉"退一赔十"

大风新闻 浏览 5845

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 4328

关键时刻委少将为美军"敞开大门" 美压制委军手段披露

澎湃新闻 浏览 7413

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 4289

美军测试“一控多”无人机群

环球网资讯 浏览 3171

范佩西首次征召儿子进入费耶诺德比赛名单,但并未安排他出场

懂球帝 浏览 3838

影视大佬吴敦离世,贾静雯林志颖发文悼念

素素娱乐 浏览 3094

理想汽车下摆臂异响补偿方案发布月余,多位车主投诉称遭区别对待

澎湃新闻 浏览 5224

郑秀晶,你要知道我十年前就跟着你了

时尚COSMO 浏览 273

媒体:欧洲有人或已接受让出格陵兰 希望美国留个体面

环球时报国际 浏览 14410

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 2688

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 4531

特朗普施压伊朗:美军舰队规模比在委内瑞拉的还大

大风新闻 浏览 7198

理想为什么不做轿车,有了解释……

道哥说车 浏览 989
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1