UltraEdit基于指令的大规模细粒度图像编辑本文介绍了UltraEdit,这是一个大规模(约400万编辑样本)、自动生成的指令式图像编辑数据集。我们的主要想法是解决现有图像编辑数据集(如InstructPix2Pix和MagicBrush)的缺点,并提供一种系统的方法来生成大量且高质量的图像编辑样本。UltraEdit提供了几个显著的优势:1)通过利用大型语言模型(LLMs)的创造力以及来自人工评分员的上下文编辑示例,它提供了更广泛的编辑指令范围;2)其数据源基于真实图像,包括照片和艺术作品,提供了更大的多样性并减少了与仅由文本生成的图像模型相比的偏差;3)它还支持基于区域的编辑,通过高质量的、自动生成的区域注释得到了增强。我们的实验表明,基于UltraEdit训练的经典扩散式编辑基准在MagicBrush和Emu-Edit基准测试中创造了新记录。我们的分析进一步确认了真实图像锚点和基于区域的编辑数据的关键作用。