关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2750人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不露腿也想穿好看,最关键的是这一点

黎贝卡的异想世界 浏览 1642

50+女人别踩坑!远离紧身裤和老年装,这样穿优雅又显瘦

静儿时尚达人 浏览 2173

央企旗下四川水电开发公司36.79%股权挂牌转让,底价19.3亿元

红星资本局 浏览 1662

比特币暴跌超20%!43万人爆仓,加密货币市场一片“哀嚎”

北京商报 浏览 2512

微软团队突破性研究:AI网页助手终于学会在新网站"随机应变"了

科技行者 浏览 1582

女喜人也太难了,但也太棒了!

时尚COSMO 浏览 1696

印度无人机成批击落,以色列武器神话翻车

浏览 5945

上海网友在日料店里吃出蛆虫 蛆虫还在炸鸡上蠕动

极目新闻 浏览 20658

女子卷走公司2000万欲跑路 最后一刻害怕被抓放弃登机

环球网资讯 浏览 9246

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 1530

以军袭击加沙城社区 至少6人死亡

财联社 浏览 1543

10月工信部新车合集:合资车企还在发力

爱驾天下 浏览 2868

6.4万star的开源智能体框架重构!OpenHands重大升级,叫板OpenAI

机器之心Pro 浏览 2413

对话钦培吉:77岁的莲花,不做六边形战士

网易汽车 浏览 3272

脑机接口再获突破,核心龙头布局多点开花

览富财经网 浏览 2744

华为登顶,吃了谁的蛋糕?

智东西 浏览 1659

技能养宠人,好麻烦,好费钱!

时尚COSMO 浏览 2731

俄主动向美通报:核动力巡航导弹上天 射程"几乎无限"

上观新闻 浏览 8115

雷克萨斯,扳回一局

电动势 浏览 2010

广东佛山路边停车为收费出"奇招" 车主吐槽:吃相难看

中国新闻周刊 浏览 5904

伊朗:战争必须以一种让敌人永远不敢再侵略的方式结束

大象新闻 浏览 98622
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1