关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者1566人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 486

宋伊人新剧被传谣,是要逼人“剖腹取粉”吗?

麻辣婊 浏览 1505

邮报:罗塞尼尔邀请麦克法兰加入切尔西一线队教练组

懂球帝 浏览 485

泰柬刚停火又开打 媒体:"特朗普和平"成了笑话

新京报 浏览 787

外观设计风格独特 本田0 α原型车发布

车质网 浏览 1302

印媒:印度将在印巴边境地区启动大规模三军联合演习

环球网资讯 浏览 1418

金九银十冲刺期:中国车企最新销量与目标完成率同步披露

汽车族杂志 浏览 1732

TCL科技110亿元收购LG Display中国业务

三言科技 浏览 1713

杨明洋:感谢罗慕洛为我助攻,也感谢南通球迷一直支持我

懂球帝 浏览 1650

中金公司出席第19届亚洲金融论坛,以国际化投行实力融通世界

时代周报 浏览 202

郑丽文上任3天《人民日报》发文促统 郑丽文判断没错

时时有聊 浏览 6884

刘强东"10年1元年薪"到期 网友曾调侃章泽天离婚分5元

红星资本局 浏览 18427

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 1196

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 1704

女网红被"开盒"收大量骚扰信息全家被迫搬离 本人发声

环球网资讯 浏览 21085

澳国防部称监测到中国舰队活动 外交部回应

财联社 浏览 1017

i茅台1499元直销飞天茅台“秒空”,每5分钟补货仍遭疯抢

红星资本局 浏览 643

今晚空降!傅东育又一力作来袭

娱乐圈笔娱君 浏览 186

牛弹琴:中国1天内新部署1艘航母6艘军舰 法媒"醋"了

现代快报 浏览 6606

中央一号文件来了!今年有哪些“新表述”?

农民日报 浏览 48

一个时代的回调:普拉多限时官降,是国产越野车的胜利注脚

燃擎频道 浏览 371
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1