关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者3207人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

实用|| 百元外套穿出万元既视感,这个思路太妙了!

黎贝卡的异想世界 浏览 3432

泰晤士:主场不敌西汉姆联,热刺正在考虑解雇主帅弗兰克

懂球帝 浏览 3052

特朗普同意停火两周

极目新闻 浏览 1493

西贝的新考题:如何券后留客

北京商报 浏览 3658

阿特金森:艾伦犯规多打乱了乱换布置,我会鼓励米切尔多冲筐

懂球帝 浏览 856

研究领军人物告别一线!广发证券全球首席沈明高到龄卸任

券商中国 浏览 2861

沪媒:上海赛更达橘橙投资人朱骏将兑现400万元冲乙奖金

懂球帝 浏览 4338

“十五五”提到的量子科技,商业化落地到哪一步了?

BT财经 浏览 4046

媒体:爱泼斯坦案2000段视频公布 震碎三观突破下限

北京日报客户端 浏览 7525

智元新一代机器人精灵G2已获数亿元订单,并开启首批商用交付

财闻 浏览 4304

A股:再刷新历史纪录!

小白读财经 浏览 4918

中山大学突破:AI实现精准图像语义搜索

科技行者 浏览 4092

迪亚曼蒂:曾有机会加盟国米,但因穆里尼奥没去成

懂球帝 浏览 4658

"斩首"行动细节揭秘:美以战机同地起飞 直扑哈梅内伊

中国新闻周刊 浏览 42869

"30年老公厕"被改成咖啡店后又遭封 当地城管部门回应

封面新闻 浏览 12781

制裁重启 伊朗军方:已准备好应对任何威胁

极目新闻 浏览 4712

今年冬天最火的靴子,越“皱”越时髦!

LinkFashion 浏览 3537

湖北U20 1-0山东U20,范绪林点射制胜

懂球帝 浏览 3342

《红色电影录音机》背后的:花高片酬请来美国人

随申Hi 浏览 3256

李在明表态:韩国站美国一边 但要妥善处理对华关系

澎湃新闻 浏览 15956

张馨予晒妈妈织的围巾!被称呼为宝宝好幸福

阿雹娱乐 浏览 2628
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1