关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4305人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马竞球迷举行午餐聚会,托雷斯、比利亚和劳尔到场

懂球帝 浏览 1244

新款奔驰GLE家族焕新上市 改变真的挺大的

汽车天涯 浏览 1633

德国总理首次访华时间被指敲定 高级经济代表团将跟随

澎湃新闻 浏览 7654

芯片初创公司,如何融资?

半导体行业观察 浏览 4290

日本首次正式参演美菲“肩并肩”军演

极目新闻 浏览 1456

杭州有人家三天“闯”进3条眼镜蛇 蛇身约小孩手腕粗

钱江晚报 浏览 21013

安切洛蒂:现在出现问题并及时修正,总比在世界杯时出错要好

懂球帝 浏览 4627

王一博风波升级!吐槽肖战等十几位明星

阿废冷眼观察所 浏览 2601

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 8740

懂王已疯,美国已乱,北约已散

识局 浏览 3360

女子开宝马住高端小区却偷榴莲 保安提醒后她又拿2件

潇湘晨报 浏览 91423

苹果发布iPhone 17e,起售价4499元

澎湃新闻 浏览 2555

岚图汽车卢放:必须啃下豪华轿车市场这块“硬骨头”

经济观察报 浏览 3791

匹克被指要求拒绝降薪员工写检讨否则就停薪 当地回应

上游新闻 浏览 9649

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 3588

万科董事长辛杰辞职!年薪0元、原定明年退休,曾多次代表深铁力挺万科

时代周报 浏览 4582

蔚来乐道汽车迎 11 万台新车交付,距离 10 万台里程碑仅 13 天

IT之家 浏览 4142

净利润暴增503倍!310亿“零食大王”,冲刺港股IPO

侃见财经 浏览 4472

白宫发了张图:“痛击加拿大鹅”

大风新闻 浏览 39274

推广 || 断舍离N次也不会断了它,买过最值的冬日单品之一

黎贝卡的异想世界 浏览 4190

企业30年燃气特许权被单方取消 两级法院判定政府违法

大皖新闻 浏览 7169
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1