关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4432人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡萨诺:有九名球员不配在尤文踢球,戴维糟糕到令人难以直视

懂球帝 浏览 4601

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 2991

亮出“小红卡”加入本地生活争夺赛,小红书不硬刚

钛媒体APP 浏览 5143

全新坦克400双线出击 Hi4-Z预售价32.98万元

网易汽车 浏览 4561

苦等14年 50岁贝克汉姆获封英国王室最高爵士头衔

封面新闻 浏览 16923

丰田探索车载无人机系统:车辆通过复杂路况之前能帮你“探路”

IT之家 浏览 4759

汽车“换道超车”,伪命题or真理?

汽车公社 浏览 4203

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 34227

众星送别袁惟仁,前妻陆元琪露面表示不再怨恨,Ella哭到说不出话

萌神木木 浏览 2719

一夜之间,矛盾又升级了!

米筐投资 浏览 4529

马筱梅晒定制红包,把婆婆张兰放感谢第一位

大中国 浏览 2965

泽连斯基:任何形式的领土交换都“不可接受”

每日经济新闻 浏览 8036

夏天穿维希格,原来这么好看

Yuki女人故事 浏览 1444

今日热点:电影《震耳欲聋》定档1004;《惊天魔盗团3》发布新预告……

伊周潮流 浏览 6934

牛弹琴:欧洲大怒 多支军队兵发格陵兰抗衡美国吞并

现代快报 浏览 3549

委内瑞拉下令搜捕美国侵略支持者

澎湃新闻 浏览 3599

4岁女孩在未锁门的车里睡觉突然失联 刑侦介入

极目新闻 浏览 10060

存储厂商争相敲定下一代标准,DDR6 研发进程提速

财闻 浏览 1321

官方出手,这一次谁也救不了狂妄自大的张雪峰?

小娱乐悠悠 浏览 3908

使命、念力与品位:AI时代的人之为人

华夏时报 浏览 2803

男子深夜抢走绍兴金店150多克黄金饰品 逃了5分钟落网

都市快报橙柿互动 浏览 5561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1