关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2230人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航达342km 比亚迪大唐申报图曝光

车质网 浏览 16

12月的奇迹,是“白”给的!

时尚COSMO 浏览 1360

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 1284

普京:美供乌"战斧"将引发局势升级 但不会改变战场局势

环球网资讯 浏览 2434

媒体:向乌提供"战斧"或只是幌子 特朗普可能另有打算

枢密院十号 浏览 16024

看了鲁豫对章小蕙的采访,最大感触是这一点

黎贝卡的异想世界 浏览 1085

双门双座+纯电后驱 全新smart #2将于2026年发布

网易汽车 浏览 1602

9.4分剧王回归,封神到最后一秒

独立鱼 浏览 2022

飞行员举报情人诈骗700余万 被告人获刑12年

红星新闻 浏览 5035

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 2379

女主播被伪装的炸弹包裹炸伤:拿起看了一眼就爆炸了

极目新闻 浏览 6685

金种子酒1.26亿卖掉金太阳药业,能否“轻装上阵”突围亏损困局?

征探财经 浏览 2111

3天6个瓜!鲜肉出轨,男星离婚,个个离谱

霁寒飘雪 浏览 2333

汽车之家官宣冬季测试真要来了:杜绝充值 喊话陈震愿意来吗

快科技 浏览 2096

泽连斯基又怂恿:中国帮忙很重要 感谢提供帮助的人

澎湃新闻 浏览 5677

123-120!里夫斯44+11,詹姆斯连续上双纪录终结,湖人绝杀猛龙

全景体育V 浏览 1686

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

上观新闻 浏览 1276

日本外务省高官今日访华 将解释高市早苗言论

界面新闻 浏览 42143

星巴克中国股权出售进入倒计时

虎嗅APP 浏览 2430

为什么说医疗AI的终局,必然有讯飞医疗一席之地?

锦缎研究院 浏览 525

夸克上线千问助手,使用阿里Qwen最强大模型

IT之家 浏览 2013
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1