关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者135人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

复盘瓦格纳"24小时哗变":一度称距莫斯科仅200公里

澎湃新闻 浏览 15161

被成都街拍惊艳!满大街都是“短上衣+低腰裤”,露小蛮腰好性感

潮人志Fashion 浏览 10445

被家暴16次女子得70%共同财产及10万赔偿 共140万余元

极目新闻 浏览 5167

票房破13亿,只是个开始

皮皮电影 浏览 740

贾静雯晒一家四口出游照 波妞身高优越直追咘咘

侦探娱乐 浏览 14350

匈牙利高官:北约和欧盟国家已事实上参与俄乌冲突

环球网资讯 浏览 18264

你奔赴热爱的样子,才是生活最好的样子

LinkFashion 浏览 11776

英特尔CEO确认:18A工艺已进入大规模量产,为三代产品奠定基础

IT之家 浏览 105

业主私挖300平地下室 同楼住户:家里没一面墙是完整的

新民周刊 浏览 5489

五角大楼被指欲购书供美军飞行员学习 名单现中国兵书

环球网资讯 浏览 67192

中国航母前出行动相对固定,战术意图是什么?

浏览 10244

扛起进攻!詹姆斯半场10中6拿下13分7板&次节8分 得分全队最高

直播吧 浏览 11944

比起辣妹风,早秋这样穿的女生才是高段位吧!

Yuki女人故事 浏览 1074

澳媒:美国剥夺了澳方主权 下一场战争或是针对中国

环球网资讯 浏览 13970

卢卡申科证实普里戈任抵达白俄罗斯

界面新闻 浏览 88457

星光大赏众女星同台争艳,有人美得很“出众”

FancyMusic 浏览 12566

库尔图瓦社媒晒国家德比扑救照:战斗直至最后,Hala Madrid

直播吧 浏览 18284

短发才是打开夏天的正确方式 这几款时尚又显年轻

成铭聊发型 浏览 16346

美国"空军和太空部队公共事务主任"死于五角大楼?

澎湃新闻 浏览 18722

仅10%援助卡车获准进入 加沙地带饥荒危机加剧

极目新闻 浏览 360

清纯外表下是强大的"野心",深扒董洁的"起伏"人生

不八卦会死星人 浏览 15822
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1