关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者1469人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

比亚迪第一/零跑新势力销冠 2025年主流车企全年销量汇总

太平洋汽车 浏览 518

枢密院十号:美军一精锐部队的关键战力暴露了

环球网资讯 浏览 11999

穆婷婷退圈,马苏沉寂,这部剧积压了7年才播,主角团全部洗牌!

不八卦会死星人 浏览 13450

扒扒爆火的《繁花》穿搭,90年代的她们好时髦

黎贝卡的异想世界 浏览 14946

莫迪对中国战略曝光,印度亮出新打法

浏览 11433

把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

三言科技 浏览 456

ABB与英伟达共同推进吉瓦级数据中心建设,800VDC供电架构引关注

环球网资讯 浏览 1662

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 609

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 1617

特警押解李小龙指认现场 邻居称其用石头砸伤前妻致死

红星新闻 浏览 80661

29岁女孩感谢蔡磊:使用其团队研发药物后病情没再发展

鲁中晨报 浏览 15811

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

静儿时尚达人 浏览 1178

布里斯班新科亚军科斯秋克:我的关于萨巴伦卡的话被断章取义

网球之家 浏览 391

富豪成老赖 万柳书院75套房源被抵押拍卖

时代财经 浏览 18790

2020欧洲杯1/8决赛,乌克兰通过加时赛2-1淘汰瑞典晋级8强

趣看热点 浏览 26943

"特朗普级"战列舰造价公布:高达220亿美元

极目新闻 浏览 312

众好友齐聚为baby庆生 黄晓明一心做“围观群众”

网易娱乐 浏览 27266

朱松玮27+4&曾凌铉三分9中9,北控战福建国内球员双双爆发

懂球帝 浏览 378

弗格森:若中锋很快融入曼联会是强队,来这的球员必须要肩负责任

直播吧 浏览 14837

今晚空降!傅东育又一力作来袭

娱乐圈笔娱君 浏览 70

朝鲜最高人民会议:废除与韩国所有经济领域合作协议

央视新闻客户端 浏览 13290
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1