关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3869人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 3313

世体:拉菲尼亚将坐在替补席额外座位上,为球队提供支持

懂球帝 浏览 4027

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 3282

微软亚研院突破:强化学习赋予语言模型规划能力

科技行者 浏览 4048

以政府:以色列被扣押人员10月11日起获释

界面新闻 浏览 4238

巴基斯坦与沙特阿拉伯签军事协议 多国受震动

环球网资讯 浏览 4952

朝鲜进行地对地战术弹道导弹试射 金正恩观摩

国际在线 浏览 1301

大衣别这么穿,显黑又显胖!

Yuki女人故事 浏览 3871

日本太空航母野心披露 被指正谋划“太空珍珠港事件”

极目新闻 浏览 3365

助贷新规落地调查:单利最低达7.56%

时代周报 浏览 4320

男子围猎多名女性自称是"公务员" 有女子给他140万

极目新闻 浏览 95850

拉波尔塔:回到诺坎普,我流下了一些泪水

懂球帝 浏览 3882

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 3886

阿里咬住字节,为卖Token拼了

中国企业家杂志 浏览 113

耗时3000小时 近40万美元拿下完美修复的路虎卫士

CLauto酷乐汽车 浏览 3016

亚马逊将对意大利反垄断罚款提出上诉:一分钱都不该罚

IT之家 浏览 3088

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 3964

泰慕士脱敏狂飙

富凯财经 浏览 4770

经典与创新的时代对话,保时捷携两款911登陆第八届进博会

观察者网 浏览 3969

长安汽车10月销量27.8万辆 同比增长11%

网易汽车 浏览 3575

李施嬅困局:被有毒关系猎杀的富家女

仙女事件簿 浏览 3248
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1