关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者216人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广西70岁退休阿姨受邀为大牌走秀 靠翻译软件独游欧洲

潇湘晨报 浏览 82227

吴绮莉独自喝苦瓜汤 分享早年工作旧照片忆苦思甜

素素娱乐 浏览 14884

记者:博格巴已经开始康复训练,好消息是没有肌肉损伤

直播吧 浏览 13750

昼夜不息!看陆航直升机空中突击

环球网资讯 浏览 18549

《浪姐》观众的讨伐,谢娜的虚假好人缘早被撕开了

传媒一班 浏览 16238

49岁曹颖和儿子小饭店被偶遇,脸色蜡黄发福明显,13岁儿子太帅气

缘木不求娱 浏览 12094

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 4066

阿卡迎大考,德约面挑战!

网球之家 浏览 15912

2024开运怎么穿?6个颜色任选一个迎好运!

日系志Yumi 浏览 12507

认为电动车不过是四轮iPhone的富士康终于意识到造车比造手机更难

界面新闻 浏览 18606

贵州2岁女童家门口失踪 父亲已去世母亲独自在外打工

红星新闻 浏览 4915

王一博被指脱发长疮身体状况堪忧 已经400多天没进组

萌神木木 浏览 67446

中国起重机在美当“木马”?外交部:草木皆兵

环球网资讯 浏览 18286

华为鸿蒙全新MPV曝光!车长5米2,比腾势D9豪华,你看好吗?

网上车市 浏览 11358

他是著名演员,临终前也没听到儿子喊声爸?

妙知 浏览 381

美军在关岛开工建造远程弹药库 美媒:中国该担心了

环球军事时报 浏览 25768

80%!为什么多数人买高配车?

帮宁工作室 浏览 10305

珠峰获救女子到达长沙 当面感谢两名施救者

每日经济新闻 浏览 91802

增速跑赢大盘3倍的长城汽车,2024要支棱起来了?

路咖汽车 浏览 12033

还记得"欢喜哥"许绍雄吗?嫁女现场堪比TVB台庆!

橘子娱乐 浏览 12778

红毯这一夜,杨幂的脸孙俪的眼,撕开女星遮羞布

缘木不求娱 浏览 12192
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1