关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者476人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

推广|| 新买的衣服人人夸!果然还得是他家

黎贝卡的异想世界 浏览 1631

2025 FT年度人物:黄仁勋

新智元 浏览 871

充满争议仍获放行:密歇根州批准为甲骨文与OpenAI超级数据中心供电

华尔街见闻官方 浏览 827

OpenAI与亚马逊签署380亿美元算力采购协议,减少对微软依赖

IT之家 浏览 1388

悦龙科技闯关北交所:研发人员大量流失,大客户秒变孙公司惹隐忧

叩叩财讯 浏览 926

比亚迪第一/零跑新势力销冠 2025年主流车企全年销量汇总

太平洋汽车 浏览 577

今年靴子怎么穿?这个思路可以解决一半冬日搭配

黎贝卡的异想世界 浏览 975

“一球制胜”周董首轮游,两ATP巡回赛冷风劲吹!

网球之家 浏览 450

最喜欢的对手,特罗萨德职业生涯对利物浦进球最多

懂球帝 浏览 479

马杜罗预计5日在纽约"首次出庭"

扬子晚报 浏览 579

官方:31岁巴西中场杜黄轩获得越南国籍,1月可为越南队出战

懂球帝 浏览 1636

达成停火22天内 仅有商定数量24%的卡车进入加沙

上观新闻 浏览 1362

致敬经典车型 宾利飞驰三款特别版官图发布

车质网 浏览 1418

尊界公众号,主体为啥变了?

车轱辘话V 浏览 1559

香港法院作历史性判决 许家印家族信托"防火墙"被击穿

经理人杂志 浏览 14569

宏胜集团法定代表人变更,郑群娣接棒祝丽丹

21世纪经济报道 浏览 1372

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 1433

演绎日式豪华MPV 全新日产Elgrand新车图解

车质网 浏览 1003

输深圳采访!杨鸣满意表现,苦恼调整空间不大,谈下场给小将机会

篮球资讯达人 浏览 388

恩里克:踢出极高的水平是我们一贯的目标;要避免球员受伤

懂球帝 浏览 1507

李昀锐和孟子义恋情爆热搜,新剧直接无人在意了

陈意小可爱 浏览 1690
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1