DPO 版本的 Stable Diffusion 模型经过人类偏好数据优化的 SD 模型,类似 LLM 的 RLHF。Checkpoint下载地址:SDXL-DPO:https://huggingface.co/mhdang/dpo-sdxl-text2image-v1SD1.5-DPO:https://huggingface.co/mhdang/dpo-sd1.5-text2image-v1