关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3031人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佳明捷力推出Primacy系列高端家庭音响

IT之家 浏览 886

理解了这轮“金铜铝牛市”的底层逻辑,也就理解了中国经济的未来

锦缎研究院 浏览 3417

一年一度的秋装趋势,来了!

黎贝卡的异想世界 浏览 6239

北约和俄罗斯空中对峙升级 推高爆发军事冲突风险

澎湃新闻 浏览 4673

沪电股份:前三季度净利润同比增长47.03%

网易财经 浏览 3958

“罗小黑”热度不减 中文在线尚未跑通IP

北京商报 浏览 3681

现代IONIQ3即将全球首发 400V架构 定位小型SUV

汽车公告板 浏览 2954

乌戈:今天是场起伏很大的比赛;过去几场打出了我们想要的风格

懂球帝 浏览 2756

邦本宜裕:给自己本赛季表现打100分,本来想完成20个助攻

懂球帝 浏览 3888

伊能静儿子逛成都,恩利吃美食被辣出表情包

疯说时尚 浏览 4084

两死者死于家中非交通事故 定损员伙同他人骗保120万

红星新闻 浏览 14831

少年抢劫2600元并参与5次殴打他人获刑11年 家属申诉

潇湘晨报 浏览 8802

迈凯伦SUV要来了,搭V8混动

懂车之道 浏览 3216

爱尔眼科,暗藏玄机!

飞鲸投研 浏览 3046

别克MPV家族2025年销量突破12.2万辆 同比增长17%

网易汽车 浏览 3202

养乐多卖不动了?

斑马消费 浏览 4162

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 3822

很运动 全新雷克萨斯ES F SPORT渲染图曝光

车质网 浏览 4646

新国标来了!曾经吹上天的辅助驾驶要“变天”了

知嘹汽车 浏览 1229

世体:弗里克奉行父亲式执教策略,阿劳霍成最新成功案例

懂球帝 浏览 2802

福建舰入列消息刷屏 美媒对其达到的技术高度表示赞叹

环球网资讯 浏览 8756
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1