关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4081人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

快手全员发开工红包:正式员工366元

三言科技 浏览 2544

3股业绩大涨!制冷剂价格持续上行

证券时报e公司 浏览 4031

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 9027

2-2!英超疯狂之战:1-2落后 10人曼联压哨绝平 0分变1分

叶青足球世界 浏览 3890

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 4146

电车失控在市区以超100km/h时速连撞15车 阿维塔回应

极目新闻 浏览 8990

Motif发布12.7B模型:用小算力挑战大模型,效率与性能的"双赢"

科技行者 浏览 2936

绿色+棕色、蓝色+棕色,这3组配色高级又好看!

LinkFashion 浏览 3073

无显示屏、靠Siri控场?苹果首款眼镜核心功能全曝光

环球网资讯 浏览 3467

67岁梁家辉春晚彩排现场 三鞠躬视频刷屏网络

黄大姐 浏览 2876

湖人惨败尼克斯!双核轰52分喜忧参半,艾顿无球权,防守真拉胯!

篮球资讯达人 浏览 2878

太好看了!!!「镖人」把我看激动了!

吐槽电影院 浏览 2385

四冠王!南外毕业生所在战队问鼎RoboMaster2025全国总冠军

现代快报 浏览 5012

2-0!申花扬眉吐气,掀翻韩国劲旅获首胜,亚冠排名超蓉城进前八

侃球熊弟 浏览 4084

暗示亨特被裁?杨鸣:下一场对阵山西我们只有两名外援出战

懂球帝 浏览 2972

10月工信部新车合集:合资车企还在发力

爱驾天下 浏览 4166

拼多多1000亿豪赌新拼姆,跨境电商变天?

Tech星球 浏览 105

高市早苗当选首相的"助攻手" 重点提携了"汉奸"石平

极目新闻 浏览 9115

今年秋天最流行的6条半裙,怎么搭都好看!

LinkFashion 浏览 4727

摩托罗拉Edge 70 Ultra现身Geekbench,处理器或有新情况

IT之家 浏览 3805

12岁男孩烫伤后死亡:死前还在干活 父母均智力残疾

新京报 浏览 8780
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1