关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者4000人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

BeingBeyond团队让30种机器人共享一个"大脑"

科技行者 浏览 2941

华境S登场在即 手捧华为智能全家桶走入寻常百姓家

网易汽车 浏览 2661

上年纪的女人买“上衣”:避开3个坑,这样选时髦又显气质

静儿时尚达人 浏览 3063

助贷新规落地调查:单利最低达7.56%

时代周报 浏览 4444

星途神秘新车轮廓曝光 又一款性能SUV要来了?

网易汽车 浏览 160

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 4279

官方:马来西亚裁判组将执法成都客战首尔,纳西鲁丁担任主裁

懂球帝 浏览 4121

全世界都被肯德基骗了?公开配方成营销噱头真的好吗?

江瀚视野 浏览 4287

领克10/领克10+全球首秀 1秒补能2公里/3.2秒破百

网易汽车 浏览 1679

广东三外配置太完美!奎因萨姆纳双能卫猛攻,萨林杰关键球收割!

篮球资讯达人 浏览 3274

泰国在建高铁事故致数十人死亡 外交部表态

界面新闻 浏览 8909

15年离婚拉锯落幕,“中国巴菲特”失去沃华医药实控权

野马财经 浏览 3927

町田外援埃里克:期待2026年世界杯能成为属于内马尔的舞台

懂球帝 浏览 316

大二女生回家途中失踪8年:父亲悬赏10万寻女无果

红星新闻 浏览 95347

增程车市场凉了?4月没一款销量过万

正在说车 浏览 337

每体:门德斯在巴塞罗那分别与亚马尔、德科进行了会谈

懂球帝 浏览 4490

广汽昊铂推“政企双补”限时礼 至高可享50000元

网易汽车 浏览 3423

没上映票房就破2400万,邓超加陈凯歌都压不住,国庆档冠军定了?

靠谱电影君 浏览 4813

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 8486

S家洗白失败!韩国综艺锤了小S忽视姐姐病情,推卸责任甩锅给大S

萌神木木 浏览 3047

以军称打死哈马斯武器装备部门负责人

新京报 浏览 3788
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1