关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2364人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李云迪风波升级!司晓迪否认嫖娼关系,爆料男方擅长用小号聊女生

萌神木木 浏览 2267

泽连斯基称德国已向乌交付“爱国者”防空导弹系统

环球网资讯 浏览 2241

更智能更豪华 乐道L90加配置会贵多少?

网易汽车 浏览 1318

标普将全球最大稳定币运营商Tether资产评级下调至最低等,质疑挂钩美元能力

华尔街见闻官方 浏览 1928

飞檐走壁"猴哥"闯进小区多日 居民开启直播播报其行踪

极目新闻 浏览 6924

欧盟调整“禁燃”,堵死自己的路

汽车公社 浏览 1646

关于生成式AI,这三个问题很关键

经济观察网 浏览 2288

版博会观察:冰箱贴凭啥成文创顶流?AI+版权如何焕新意?

南方都市报 浏览 2375

小米汽车又出事?车轮脱落事故,雷军紧急辟谣!

象视汽车 浏览 1775

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 2552

扫街榜百日奇袭:高德正在成为AI时代的超级枢纽

光子星球 浏览 1364

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 2483

星途七年七换帅,高管动荡魔咒如何破?

电动势 浏览 2469

"女首相梦"悬了的高市公开支持赖清德 日本亲华派翻脸

梁讯 浏览 6245

人类遗忘的难题解法,被GPT-5重新找出来了

量子位 浏览 2482

4-1!中国男足大反弹,一举终结2连败,15岁小将大四喜,出线有戏

侃球熊弟 浏览 2399

马丁·厄德高:阿森纳英超近失球经历是“动力”

绿茵情报局 浏览 1193

最高法改判福清祖屋强拆案后 屋主再提诉讼

澎湃新闻 浏览 2451

65岁钟楚红近况曝光!老公去世18年未再嫁

代军哥哥谈娱乐 浏览 1283

中国加速构建具身智能数据标准体系 “浦江X”平台发布

上观新闻 浏览 2777

50+女性秋日别瞎打扮,这3招让你告别油腻感,优雅好气质

静儿时尚达人 浏览 2230
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1