![]()
这项由浙江大学计算机科学与技术学院吴涛、江逸博等研究人员领导的团队,联合浙江大学软件技术学院和华为技术有限公司,于2025年9月发表的研究成果,解决了AI绘画领域一个令人头疼的技术难题。该研究成果以论文形式发表,论文编号为arXiv:2509.21953v1,为多主体图像生成技术带来了突破性进展。
当前的AI绘画技术已经能够根据用户提供的照片,生成单个人物的精美图像。但是,当我们要求AI在同一张图片中绘制多个不同的人物时,问题就出现了。就像一个初学画画的孩子,AI经常会把不同人的特征混在一起,比如把张三的眼睛画到了李四脸上,或者让王五戴上了赵六的帽子。这种现象被研究人员称为"属性泄漏",就好比调色板上的颜料不小心混合了,原本清晰分明的色彩变得模糊不清。
更令人困扰的是,即使AI勉强画出了多个人物,生成的图像往往无法满足人们的审美期待,缺乏真实感和艺术美感。这就像一位厨师虽然知道所有的食材,但却不知道如何搭配才能做出令人满意的佳肴。
面对这些挑战,浙江大学的研究团队开发了一套名为"MultiCrafter"的全新框架。这个框架就像一位经验丰富的导演,能够精确指挥每个"演