关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者1526人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

绝望的日本车:搞新能源押错了宝,随时有可能被国产车一波推

小李车评李建红 浏览 795

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

量子位 浏览 11686

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 1318

绍伊古:北约"大军压境" 俄加快在西部新建两个军区

参考消息 浏览 87660

为避免与白宫格斗冠军赛冲突 法国推迟举行G7峰会

环球网资讯 浏览 5940

携手华为!横琴基地每年将培养3000名“数智人才”

海外网 浏览 409

乐聚机器人已完成股改,正推进IPO计划,刚完成15亿元融资

红星资本局 浏览 1538

光伏黑马一道新能冲刺IPO:背靠豪华资方,出货量全球前十

澎湃新闻 浏览 13395

排队200桌,这个地域火锅成了今冬“顶流”

餐饮老板内参 浏览 379

长安汽车董事长:行业营销无底线 车子非要说上千万

智车情报局 浏览 13447

媒体人:同曦管理层表示加盟青岛只是赵柏清经纪人的一厢情愿

直播吧 浏览 14848

3天破24.3亿中美观众不买账,《哪吒2》年冠稳了

靠谱电影君 浏览 718

腾势D9将迎来第30万辆交付

大象新闻 浏览 1027

E句话| 她也遇到过阴阳剧本?

仙女事件簿 浏览 1533

权力重构?泽连斯基亲信部队高层遭反腐

浏览 5017

海信发布两款颠覆级激光显示新品,显示产业形态创新迈向关键拐点

IT之家 浏览 2242

曝英特尔、AMD已售出今年大部分服务器CPU产能,考虑Q1涨价

IT之家 浏览 350

终于!Windows 11迎来蓝牙音频共享功能:可惜还是有限制

快科技 浏览 1368

李璇:三镇开出国内球员顶薪与邓涵文续约,但没能续约成功

懂球帝 浏览 974

男子家中冰箱门关不上灵机一动求助AI 差点花了冤枉钱

潇湘晨报 浏览 15758

北约:将考虑对俄罗斯发动“先发制人”的打击

环球网资讯 浏览 14405
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1