关闭广告

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者6人阅读


当你看到一个AI生成的视频,画面中一个人正在递给另一个人一杯咖啡,你可能会觉得这很自然。但如果仔细观察,你会发现很多问题:咖啡杯可能突然消失了,递咖啡的人变成了两个人,或者咖啡杯莫名其妙地漂浮在空中。这些看似简单的交互场景,对AI来说却是极大的挑战。

来自韩国科学技术院(KAIST)AI实验室的研究团队,包括Siyoon Jin、Seongchan Kim、Dahyun Chung、Jaeho Lee、Hyunwook Choi、Jisu Nam、Jiyoung Kim和Seungryong Kim,在2025年10月发表了一项突破性研究。这项名为"MATRIX: Mask Track Alignment for Interaction-aware Video Generation"的研究,首次系统性地解决了AI视频生成中的交互理解问题。有兴趣深入了解的读者可以通过arXiv:2510.07310

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华为车BU新公司“引望”正式成立 注册资金10亿

网易科技报道 浏览 12289

吉利银河E8上市,售价区间17.58-22.88万元

网易科技报道 浏览 12061

金顺凯:没想到教练会用我 希望国奥能出线进军巴黎奥运会

直播吧 浏览 11505

“一哥”蔚来加速掉队,李斌卷不动了?

雪豹财经社 浏览 15940

官方:戈尔迪奇、张午、蒋志鑫加盟无锡吴钩

直播吧 浏览 15116

2024,当中国开始“卷”民营火箭

观察者网 浏览 12476

看点超多!6只新股本周申购,北交所这只新股发行价仅3.7元;跨界锂电的原料药细分龙头登陆A股

证券时报e公司 浏览 18346

光线传媒董事长王长田谈AI:未来属于会创造性使⽤AI的⼈

每日经济新闻 浏览 18814

小伙用"摇一摇"睡了多名女子 还在车上与多人发生关系

胖胖侃咖 浏览 73576

费兰-托雷斯:我曾陷入无底深潭 若要战胜曼联就必须亡命奔跑

直播吧 浏览 18649

男子跑朋友房间找烟在床底摸到1只冰手 掀开床板懵了

社会奇闻君 浏览 117156

金智秀最新大片撞脸蔡依林!网友不敢认,颜值高却被吐槽演技太差

文艺圈娱乐号 浏览 12509

华为广汽新车明年6月上!任正非建议品牌名,徐直军参与造型评审

车东西 浏览 366

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 133

炎热的夏季 谁能够拒绝靓丽的绿色系呢?

虎哥说衣不二 浏览 14418

realme 真我 12 Pro 系列手机 2 月 27 日国内发布

IT之家 浏览 11908

温碧霞一家3口出游,13岁养子越长越像富豪父亲

叶公子 浏览 13969

1-6,3-6!朱琳连丢两盘不敌世界第一,温网惨遭一轮游

ALL体育 浏览 15229

媒体:高市早苗疯言台湾问题 中方对她没什么好客气的

新民晚报 浏览 4181

离婚14年,宁静汪峰再传绯闻,前夫儿子为她争光

枫尘余往逝 浏览 257

翁帆:杨先生离开时一定很欣慰 他交出了份满意的答卷

光明日报 浏览 4007
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1