关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者841人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI“碰撞”量子 一场颠覆未来的创新变革在这里诞生

上观新闻 浏览 1541

今夏最佳转会是❓罗马诺:麦卡利斯特,伟大的转会,只花近4000万欧难以置信

直播吧 浏览 14155

迈尼昂:有人说我经常受伤?我们是场上最容易受到冲击的球员

懂球帝 浏览 952

胡锡进炒股首日赚104.78元 称以后会陆续加仓

网易财经 浏览 16025

纳乔亲承续约:尽管一直有外界的报价,但我决定再留队一年

直播吧 浏览 16388

Kindle告别中国:电子书店停止运营,无法再买新书

界面新闻 浏览 15564

磁浮底盘/全铝车身 凯迪拉克新CT6上市28.99万起

网易汽车 浏览 815

内饰配置再提升 新款极氪X内饰官图发布

车质网 浏览 618

用友网络回应华为进军ERP致股价跌停:反应过度

界面新闻 浏览 18877

跌落神坛!“逼疯”黄奕,“整了”周迅的他,因王家卫再次被牵连

温柔娱公子 浏览 573

杨颖带儿子现身机场 私服全身配饰近10万忙着赶路

萌神木木 浏览 14402

记者:新月为米神报价5500万欧元,富勒姆的理想价位是6000万欧元

直播吧 浏览 14326

女童迪士尼疑遭插队黄牛撞倒 家长:她脸贴地飞出3-4米

上游新闻 浏览 91014

东风日产N6最新申报图曝光:选装轮圈与红色卡钳

网易汽车 浏览 1015

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者 浏览 563

苹果股价创历史新高

都市快报橙柿互动 浏览 920

梅西亮相淘宝直播间!数百万粉丝涌入 有人却不开心了

每日经济新闻 浏览 15959

这才是真正的素人穿搭模板 穿衣小白也能学会

巧百搭 浏览 17033

以军称已按加沙地带停火协议完成撤军

极目新闻 浏览 970

曝特朗普要攻击拜登,卸任后将首次公开露面并讲话

趣看热点 浏览 220279

中国金花夺冠第7人!王欣瑜比肩李娜郑洁,法网进账335万巨奖

ALL体育 浏览 16446
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1