关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3160人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

登上热搜!王欣瑜激战阿尼西莫娃

网球之家 浏览 3282

多品牌疑"删除"张雨绮代言内容 此前其被实名举报代孕

现代快报 浏览 6757

拜仁26/27赛季客场球衣谍照:白色主色调,队徽内EV字样回归

懂球帝 浏览 4454

媒体:欧盟触碰伊朗"红线" 伊朗对欧洲的批评很醒目

环球网资讯 浏览 9786

女孩被篮球砸头后确诊癔症自残失禁 母亲:我也不理解

上游新闻 浏览 10201

富士展示“无镜头相机”:光学器件与AI算法重构图像

IT之家 浏览 4184

合计亏超22亿元,牧原、温氏一季度双双转亏

中国基金报 浏览 1432

中企在非洲因环境问题引争议 遭800亿美元天价索赔

澎湃新闻 浏览 41778

报道:欧央行官员们表示,降息周期很有可能结束了

华尔街见闻官方 浏览 3644

宁波方正携手山东未来机器人,聚焦深海机器人业务

财闻 浏览 4287

11.99至15.99万元 长安启源A06开启预售

网易汽车 浏览 4891

普通人如何“偷偷”变美?她的4个微习惯很好抄

黎贝卡的异想世界 浏览 2855

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 4408

郝蕾跟辛芷蕾杠上了?

大龄女一晓彤 浏览 3977

福建发布人工智能扶持新政:拟对企业年度算力购买最高补助50%

观察者网 浏览 4055

从“提效”到“稳进”:2026直播电商进入精耕细作时代

惊蛰研究所 浏览 3223

约6000人被埋加沙废墟下 哈马斯:不会离开自己的土地

红星新闻 浏览 4504

2025年,他们集齐了十二枚臂章

我们的太空 浏览 2756

全球首创!西安造创新医疗器械获批上市

上游新闻 浏览 4378

每体:加维可能随巴萨前往沙特,为参加西超杯队友加油助威

懂球帝 浏览 3543

伊朗陆军司令:伊斯法罕省行动失败是敌方停火主因

界面新闻 浏览 1456
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1