关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2755人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这娱乐圈顶级渣男,居然翻身了

独立鱼 浏览 1837

更年轻动感 全新马自达CX-5正式首发亮相

车质网 浏览 2585

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 3515

1399元,JBL SOUNDGEAR CLIPS琉璃扣耳机预售

IT之家 浏览 2485

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 2645

纳斯达克中国金龙指数跌0.4%

证券时报 浏览 1540

狂发钱的元宝派,除了领红包还能用来干嘛?

量子位 浏览 1463

中国停购后 美国大豆真"爆仓"了人们四处逃散

澎湃新闻 浏览 10663

香港火灾现场明火已逐渐被扑灭 消防员将开始上楼搜救

每日经济新闻 浏览 32554

美联储新主席是鹰是鸽

北京商报 浏览 1457

澳大利亚女足近3次亚洲杯半决赛保持不败,共6次参赛4次晋级

懂球帝 浏览 612

RedPlay新阵地:小红书游戏行业峰会解码「种草用增」新思路

环球网资讯 浏览 1425

马切吉亚尼:迈尼昂扑点的秘诀是米兰的门将教练菲利皮

懂球帝 浏览 2537

《新闻女王2》首播爆开!开局高能剧情紧凑,黄宗泽演技拖后腿

萌神木木 浏览 2482

将于12月5日上市 别克至境世家广州车展发布

网易汽车 浏览 2342

队报:消息人士称罗塞尼尔并不在切尔西新帅候选名单上

懂球帝 浏览 1934

每体:西甲启动2027-32赛季在西班牙的电视转播权拍卖

懂球帝 浏览 2567

张水华开直播官宣周五出发周末战重

劲爆体坛 浏览 1649

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 2532

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 2643

加拿大新外长就任后首次访华 外交部回应

新京报政事儿 浏览 8052
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1