关闭广告

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者1695人阅读


当你看到一个AI生成的视频,画面中一个人正在递给另一个人一杯咖啡,你可能会觉得这很自然。但如果仔细观察,你会发现很多问题:咖啡杯可能突然消失了,递咖啡的人变成了两个人,或者咖啡杯莫名其妙地漂浮在空中。这些看似简单的交互场景,对AI来说却是极大的挑战。

来自韩国科学技术院(KAIST)AI实验室的研究团队,包括Siyoon Jin、Seongchan Kim、Dahyun Chung、Jaeho Lee、Hyunwook Choi、Jisu Nam、Jiyoung Kim和Seungryong Kim,在2025年10月发表了一项突破性研究。这项名为"MATRIX: Mask Track Alignment for Interaction-aware Video Generation"的研究,首次系统性地解决了AI视频生成中的交互理解问题。有兴趣深入了解的读者可以通过arXiv:2510.07310

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

空军发布重磅视频 多款新型战机亮相

参考消息 浏览 1222

900万粉丝网红到一村庄办杀猪宴:村民收场地费还分肉

极目新闻 浏览 18546

中超第27轮传球成功率榜:国安第一

体坛周报 浏览 1909

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 803

这些老电影里的穿搭技巧,绝了!

Yuki女人故事 浏览 1768

德国外长在广州表态:看到与中国建设性合作的机会

环球时报国际 浏览 17947

被60+阿姨的衣品惊艳:裙不上膝、衣不穿花,美得高级又洋气

静儿时尚达人 浏览 1732

特朗普:俄方知道美国在俄海岸附近部署核潜艇

环球时报 浏览 1821

这届大美人,怎么入冬撞衫率100%

时尚COSMO 浏览 1546

美军参联会主席警告:对伊朗动武可能带来重大风险

央视新闻客户端 浏览 19

我玩我的,管你是谁!亏近50%鑫元消费甄选值得“点赞”!

一地基毛 浏览 1843

比加班更可怕的,是可能加班

识局 浏览 998

3天破24.3亿中美观众不买账,《哪吒2》年冠稳了

靠谱电影君 浏览 1100

以军两个方向朝加沙城市中心推进

环球网资讯 浏览 2750

重马一跑者倒地去世 跑友:他在跑圈被称为"破三大神"

红星新闻 浏览 10552

许绍雄最新状况!戴氧气罩不能说话,大半港圈明星探视人缘极好

萌神木木 浏览 1793

鲁内眼中,那个让他敬畏的辛纳是如何炼成的

网球之家 浏览 842

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 1847

葡萄牙宣布将于9月21日承认巴勒斯坦国

上观新闻 浏览 2697

张凯丽34岁嫁给作家,偏偏生了个不省心的女儿?

娱乐看阿敞 浏览 1830

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 721
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1