关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3286人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张智霖儿子返港,185魔童气质提升

星夜涟漪 浏览 3120

浙媒:体育局负责人介绍,浙江FC改名一事并未提上日程

懂球帝 浏览 3033

脑机接口再获突破,核心龙头布局多点开花

览富财经网 浏览 4232

多家银行挂牌信用卡不良资产

中国基金报 浏览 3690

伊朗外长:美国是否真心实意进行谈判还有待观察

国际在线 浏览 1095

买手机前必看!安兔兔1月性能排行更新:第一名甩开垫底近40万分

快科技 浏览 3061

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 3001

直击海上训练场!多舰协同补给现场震撼来袭

环球网资讯 浏览 281

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 4384

财务报告存在错报!联创光电及董事长被警示,此前公告董事、监事被留置

红星资本局 浏览 4207

清华字节跳动首创视频换脸新纪元:让照片主角完美融入视频场景

科技行者 浏览 3131

泽连斯基:与美国的谈判并不容易

新华社 浏览 3561

因家人病危,布里斯班狮吼主教练将缺席下轮联赛

懂球帝 浏览 3176

千亿豪赌,甲骨文会成“甲骨文”?

每日资本论 浏览 3549

卫报:欧冠决赛英国非法播放量超1620万次,合法观众700多万人

懂球帝 浏览 147

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 54952

俄大使披露:美军控制马杜罗时 没打算让任何人活下来

扬子晚报 浏览 7663

老板电器的中年突围:业绩扛压、高分红、猛投 AI

博望财经 浏览 904

Intel大小核根本停不下来!甚至要做“统一核心”

快科技 浏览 2539

斯塔默将访华:不学卡尼 中英关系不会激怒特朗普

澎湃新闻 浏览 7004

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 4156
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1