关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3123人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗伊斯兰革命卫队:战争的结束由伊朗决定

界面新闻 浏览 1156

增持回购潮背后的A股信心

北京商报 浏览 2688

以部长:已接回人质 必须重启战争打开加沙"地狱之门"

看看新闻Knews 浏览 3168

小米Watch Type-C充电底座发布:磁吸设计、共用手机线,39元

IT之家 浏览 1226

泰国总理:泰军方已控制几乎全部目标区域

每日经济新闻 浏览 2310

普京:俄罗斯将在战场解放本国故土 欧洲"猪猡"将下台

参考消息 浏览 13004

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 3041

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 3086

华为坤灵中国行首站落地上海,助力中小企业智能化跃升

上观新闻 浏览 2467

Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

硅星人 浏览 2981

带队英超客胜曼城和利物浦,阿莫林是近五个赛季唯一一人

懂球帝 浏览 3317

A股上市行第二位80后行长来了!44岁王亮任职资格获批,出任苏农银行行长

时代周报 浏览 382

新春穿搭新趋势,天猫服饰与百大品牌共同演绎新年吉服美学

LinkFashion 浏览 2069

商务部回应审查Meta收购Manus:须符合中国法律法规

财联社 浏览 12773

vivo TWS 5:一场耳机里的「音乐革命」

36氪 浏览 2488

贺娇龙被安葬在父亲身边 昭苏居民:她对昭苏功不可没

潇湘晨报 浏览 11561

被京东狠狠拿捏了!春节砸13亿给一线员工发红包

雷科技 浏览 1860

泰国外长:泰柬将于12月24日举行会谈 讨论停火细节

财联社 浏览 2272

乌军袭击一生产弹道导弹的俄军工厂

每日经济新闻 浏览 1437

小个子秋季穿搭指南!7件单品穿出大长腿,显高10cm

Yuki女人故事 浏览 5014

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 2792
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1