关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4352人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

舍伍德:大家都想看枪手掉链子,但我真希望他们赢得英超冠军

懂球帝 浏览 3818

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 4488

哪吒汽车“重启”新进展

大象新闻 浏览 3863

杨曙光委员:国产科学仪器“突围战”,上海如何打造“科技之眼”?

上观新闻 浏览 3336

拼了,TA:雄鹿计划用现有资源进行重磅引援来挽回字母哥

懂球帝 浏览 3754

“棋子部署就位” 美国为何执意搅动加勒比海

上观新闻 浏览 4108

2025 全球十大工程成就发布:DeepSeek、人形机器人等入选

IT之家 浏览 4736

这不是危言耸听:最快明年,比亚迪的插混和纯电,就没有区别了

小李车评李建红 浏览 4525

闫学晶被代言商索赔,口无遮拦坑了全家

萌神木木 浏览 3554

二次封后的宋佳凭什么狂妄?

无处不风景love 浏览 4241

张馨予医院打吊水!自曝体重降到100斤体质变差

韩小娱 浏览 3271

章小姐罕见谈婚姻,这个词用得太妙了

Yuki女人故事 浏览 3355

台湾教授苑举正痛心疾首:赖清德称"终战"是愚不可及

大象新闻 浏览 9862

42岁暴瘦脱相崩溃大哭的蒋欣,给所有人提了个醒

阿会情感 浏览 4221

特朗普大规模换大使:涉及30多国 均在拜登时期上任

齐鲁壹点 浏览 8904

当反向过年走红 留在北京的网约车司机"狠狠捡漏"

第一财经资讯 浏览 19911

谢霆锋现实长什么样?路人镜头暴露真实身高,突然理解李诞了

温柔娱公子 浏览 4430

以AI治AI 推动智能向善 巨量引擎商业安全开放日在京举办

一点财经 浏览 4431

美媒披露:美空军8天内向中东地区调派至少42架重型运输机

环球网 浏览 3234

林心如自曝爱花钱,感慨霍建华太节省,网友:不懂二人咋在一起

萌神木木 浏览 4271

曹德旺退休其子接棒 老了……

道哥说车 浏览 4427
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1