关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2031人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

突破LLM遗忘瓶颈,谷歌「嵌套学习」让AI像人脑一样持续进化

机器之心Pro 浏览 1891

文晏回应争奖!直言不认识白百何否认沪圈投资,白百何再次内涵

萌神木木 浏览 1960

被称为“电动化”的时代 燃油车杀回来了?

道哥说车 浏览 2179

Win10用户纷纷转向Linux!Zorin OS称72%新下载来自Windows

快科技 浏览 2122

定位大型旗舰SUV 零跑D19预告图发布

车质网 浏览 1972

巴沙尔倒台,土耳其成最大赢家,最大输家是谁

浏览 24613

特朗普:俄乌应按当前战线划界停火、各自撤兵

新华社 浏览 2194

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 1396

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 1545

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 2148

北约和俄罗斯空中对峙升级 推高爆发军事冲突风险

澎湃新闻 浏览 2704

三星美国泰勒晶圆厂3月测试EUV光刻机,加速2nm GAA工艺部署

IT之家 浏览 1019

这条裙子,今年悄悄火遍全网,冬天穿好有氛围

黎贝卡的异想世界 浏览 1595

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 1905

极氪8X车型最新谍照曝光,展示尾灯造型

IT之家 浏览 1234

李斌、雷军“吹哨”,芯片危机又来了

汽车公社 浏览 886

TA:利物浦的状态有所回暖;热刺展现了足够的斗志和韧性

懂球帝 浏览 1389

英国证实参与美国北大西洋扣押油轮行动

澎湃新闻 浏览 923

阿斯:皇马想延续阿拉巴和吕迪格的成功,以免签的方式签中卫

懂球帝 浏览 736

洋河股份变脸!取消70亿保底分红,2025年利润暴雷

杠杆游戏 浏览 864

伊朗最高领袖顾问:特朗普理应担心有更多美国人伤亡

环球网资讯 浏览 19745
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1