关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3486人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普同意停火两周

极目新闻 浏览 743

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 2523

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 3700

2026款奔驰EQE上市 售价47.8-62.7万元

车质网 浏览 2476

50岁阿姨也能穿得亮眼高级,这些搭配的技巧请收好,特别实用

静儿时尚达人 浏览 5657

央视年代剧《老舅》开播!这部剧又要火向全国

皮皮电影 浏览 2172

私募代持“罗生门”:15万“友情投”被净值击穿

华尔街见闻官方 浏览 2781

伊朗公布伊方最新谈判方案

国际在线 浏览 6

特朗普急于将爱泼斯坦案翻篇 仍有250万页文件未公布

极目新闻 浏览 95543

马筱梅不再隐瞒!直播掀上衣展示孕肚

老塕是个手艺人 浏览 2757

谷歌推迟安卓设备上谷歌Assistant向Gemini的迁移计划

IT之家 浏览 2793

男子认亲1年后被警方告知"亲哥找到了":那家里的是谁

极目新闻 浏览 16036

谭松韵,为什么百搭?

温柔娱公子 浏览 2683

男子在养生馆按摩后猝死次日才被发现 家属索赔140万

红星新闻 浏览 4778

马斯克的「移动客厅」又火了:20人座无方向盘,每公里才3毛钱

机器之心Pro 浏览 2745

东升西降?拆解全球车企三季报,中国车企业绩更稳

大李说车 浏览 3036

开演唱会!加入新公司!赵露思迈入新篇章

勺哥乡村味道 浏览 3286

全面迈入全域AI 2.0时代 吉利汽车携全系产品技术亮相车展

网易汽车 浏览 2

哈马斯代表团:与以色列间接谈判取得积极进展

国际在线 浏览 3022

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 2555

《浪姐7》4大“赢家”,出道多年不及参加一档综艺,选择真重要

娱乐圈笔娱君 浏览 478
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1