![]()
扩散模型就像是一位神奇的画家,它能从一片混乱的噪点中逐步画出美丽的图像。不过,这位画家在作画时面临一个关键选择:它应该专注于去除画布上的噪点,还是直接描绘最终的图像轮廓?这个看似简单的问题,实际上一直困扰着AI研究领域的专家们。
这项由独立研究者领导的突破性研究发表于2026年1月,论文编号为arXiv:2601.21419v1,首次为这个困扰提供了完整的理论答案。研究团队发现,最佳的预测策略竟然取决于数据本身的"维度特征"——也就是说,不同类型的数据需要不同的处理方式,就像不同材质的画布需要不同的画笔一样。
在AI绘画的世界里,研究人员长期以来一直在三种不同的"作画方式"之间摇摆。第一种叫做"噪声预测",就像画家专门研究如何清除画布上的杂点;第二种是"速度预测",类似于画家掌握画笔移动的节奏;第三种则是"数据预测",相当于画家直接描绘最终想要的图像。令人意外的是,随着AI绘画从简单的低分辨率图像发展到复杂的高分辨率作品,最有效的作画方式也在悄然改变。
研究团队通过深入分析发现,当处理高维度、复杂的图像数据时,直接描绘最终图像的方式往往效果更好。这就好比在一张