关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3999人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“花式”揽储:有银行送鸡蛋吸引他行储户,多家中小银行上调存款利率……

中国基金报 浏览 3258

蔚来 ES6 汽车将迎里程碑时刻,第 30 万台今年 11 月交付

IT之家 浏览 3451

中央定调!“十五五”目标确立,未来5年养老金还会涨吗?

数字财经智库 浏览 4183

今年秋天穿小香风外套,配阔腿裤太好看了!

LinkFashion 浏览 3508

哈工大发现漫画思维:让AI像看连环画一样做数学题

科技行者 浏览 3018

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者 浏览 3971

外观微调配置全面 小鹏P7+新老款车型对比

车质网 浏览 3078

反趋势?理想汽车盈转亏!MEGA召回烧没11亿元?

道哥说车 浏览 3857

丁俊晖:来英锦赛心情和状态好;与特鲁姆普比赛是最难的

懂球帝 浏览 3816

马斯克承认其他车企不想获得特斯拉FSD授权:他们简直疯了

IT之家 浏览 3823

仅仅是 AI,并不能让硬件更「智慧」,更重要的其实是这个

极客公园 浏览 4213

SpaceX称识别并切断缅甸电诈园区周边逾2500台“星链”设备

澎湃新闻 浏览 4135

她的发型又火了!年底做头发,不妨从这篇找找灵感

黎贝卡的异想世界 浏览 3326

大疆Osmo Pocket 4云台Vlog相机被曝3月发布,分标准/Pro版

IT之家 浏览 3195

3岁女童16楼走道坠亡 父母起诉开发商、物业索赔51万

红星新闻 浏览 16676

历史首次,“三桶油”收盘全部涨停!

红星资本局 浏览 2496

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 3580

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 4342

群核科技,摸着李飞飞过河

极客公园 浏览 3447

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 4195

多国表示不参与霍尔木兹海峡护航 特朗普抱怨盟友

齐鲁壹点 浏览 112432
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1