关闭广告

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者820人阅读


当你看到一个AI生成的视频,画面中一个人正在递给另一个人一杯咖啡,你可能会觉得这很自然。但如果仔细观察,你会发现很多问题:咖啡杯可能突然消失了,递咖啡的人变成了两个人,或者咖啡杯莫名其妙地漂浮在空中。这些看似简单的交互场景,对AI来说却是极大的挑战。

来自韩国科学技术院(KAIST)AI实验室的研究团队,包括Siyoon Jin、Seongchan Kim、Dahyun Chung、Jaeho Lee、Hyunwook Choi、Jisu Nam、Jiyoung Kim和Seungryong Kim,在2025年10月发表了一项突破性研究。这项名为"MATRIX: Mask Track Alignment for Interaction-aware Video Generation"的研究,首次系统性地解决了AI视频生成中的交互理解问题。有兴趣深入了解的读者可以通过arXiv:2510.07310

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

萨拉赫还是萨卡?墨菲:萨拉赫,他总能进些不可思议的球

懂球帝 浏览 776

百果园,崩了!

斑马消费 浏览 12844

俄乌冲突一周年,中国车企正在“攻城略地”

华商韬略 浏览 19765

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 870

中国国防费公开透明合理适度 比上年执行数增长7.2%

国防部发布 浏览 11560

巴基斯坦防长警告阿富汗:任何袭击都将招致50倍强度的回应

环球网资讯 浏览 943

俄反对派人士狱中放风后失去知觉身亡 拜登发表讲话

红星新闻 浏览 81116

全新旗舰级SUV 奥迪Q9霍希版谍照曝光

车质网 浏览 805

全球数百美军高级将领突然被召回 特朗普发声

环球网资讯 浏览 1692

体坛:国足候选主帅佩特科维奇正与阿尔及利亚谈签约

懂球帝 浏览 12823

邓紫棋热恋3年男友赠百万钢琴,喜极而泣感动到哭

趣看热点 浏览 26803

谁还看直播?斗鱼去年又亏,市值一年多没了620亿,但新活动“给力”

市界 浏览 19306

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

极目新闻 浏览 68636

瓦格纳负责人普里戈任动向成谜 旗下公司发声

界面新闻 浏览 16299

39岁郭碧婷复出 胖一大圈越来越像向太

叶公子 浏览 14634

59天后的春晚,她必是焦点

Yuki女人故事 浏览 179

乌克兰危机全面升级满两年 中国代表再次开启穿梭外交

央视新闻客户端 浏览 12901

以军两个方向朝加沙城市中心推进

环球网资讯 浏览 1880

美股三大指数收盘齐创新高,英特尔涨超22%

中新经纬 浏览 1951

马卡:皇马对本泽马关上回归的大门,他不在俱乐部计划中

直播吧 浏览 12818

退出春晚、被综艺开除,贾玲的下场竟然如此?

阅识 浏览 935
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1