关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1735人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 3075

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 2754

中信银行开年搅局!中信金租增资至120亿,杀进头部第八位

密探财经 浏览 1445

村支书逆袭:如何把集体的“包袱”变成个人的“聚宝盆”?

壹只灰鸽子 浏览 1461

央视公开“点名”孙俪,原来张艺谋没说错

银河史记 浏览 2557

2026 春节档终极 PK!沈腾周星驰二次交手

第一娱记 浏览 1693

C罗确认缺席本轮沙特联,此前有消息称其因不满PIF拒绝出战

懂球帝 浏览 1472

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 2025

引领效率革命、深挖万亿红利,京东工业的价值逻辑

尺度商业 浏览 2109

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 2771

大S纪念雕像正式揭幕!超10位明星出席,前男友周渝民也现身了

萌神木木 浏览 1430

辛纳2-0德米纳尔,12连胜对手晋级ATP500维也纳站决赛

懂球帝 浏览 2712

5部电影亏了8亿,古天乐不甘心,又带来三部生猛大片

娱乐圈笔娱君 浏览 1753

女子连续偷吃5个蛋挞 转身大摇大摆走掉

极目新闻 浏览 21154

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐 浏览 1419

斯诺克英格兰公开赛决赛第一阶段:周跃龙2-6落后于马克-艾伦

直播吧 浏览 3551

大S纪念雕像揭幕时间曝光 具俊晔小S揭开黑色帆布

扒虾侃娱 浏览 1533

有4S店0成交,购置税新政实施6天,哪些车依然好卖?

路咖汽车 浏览 1753

火速认错!孙怡驾驶法拉利跑车违规

今古深日报 浏览 1784

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 2582

全新比亚迪SHARK6亮相 1000km综合续航+L2级智驾

华庭讲美食 浏览 2434
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1