关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4206人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

人字纹,高级又经典!

Yuki女人故事 浏览 3234

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 3298

美伊谅解备忘录细节:霍尔木兹海峡航运"无限制通行"

央视新闻客户端 浏览 142

eSIM手机,来了!

中国基金报 浏览 4368

卷首语 | 拒绝和解的勇气

时尚COSMO 浏览 4112

爱尔眼科,暗藏玄机!

飞鲸投研 浏览 3183

北京香山论坛引西方媒体高度关注 中国防长讲话被报道

环球网资讯 浏览 16276

TA:从多纳鲁马到塞门约,瓜帅的足球风格已从控球转变为反击

懂球帝 浏览 3269

美伊谈判前景不明:美称"看到进展" 伊称暂无会谈安排

上观新闻 浏览 1129

《爸爸去哪儿》村长李锐,52岁签迪拜12亿大单

草莓解说体育 浏览 4434

进化是否足够?法拉利Amalfi首测:新名字,旧传统

ams车评网 浏览 3309

芒果这部剧,让人读懂“太平”二字的千钧重

娱乐圈笔娱君 浏览 3014

确认鹿晗和关晓彤分手,透露女方酒局没醉过

蕾爸退休日记 浏览 3426

隆源股份历史合资身份或存涉税风险,寄售库存商品监盘比例竟不足1%,国金证券是否尽责?|读懂IPO

时代周报 浏览 3246

德国联邦统计局数据显示:今年前8月,中国再成德最大贸易国

环球网资讯 浏览 4257

李玟账号被异常登陆!最新解读

环球网资讯 浏览 4325

申万宏源:牛市1.0高点看26年春季 关注储能、存储、创新药与国防军工

智通财经 浏览 4007

环球:荷兰不要低估中方维护正当权益的决心与能力

环球网资讯 浏览 8339

Beats苹果iPhone 17e专用保护壳发售,399元

IT之家 浏览 2472

U23国足防线多人有伤在身,后卫鲍世蒙开场不久伤退

懂球帝 浏览 3168

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 3033
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1