DPO版本的StableDiffusion模型经过人类偏好数-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

IT界那些事儿

3 年前

truetechforward

DPO 版本的 Stable Diffusion 模型

经过人类偏好数据优化的 SD 模型，类似 LLM 的 RLHF。

Checkpoint下载地址：

SDXL-DPO：https://huggingface.co/mhdang/dpo-sdxl-text2image-v1
SD1.5-DPO：https://huggingface.co/mhdang/dpo-sd1.5-text2image-v1

AI资讯

CSDN App 扫码分享

分享

1

2

打赏

复制链接
举报

下一条：

在真正的神经细胞中hebb 机制的作用是记忆侧向抑制的作用是特征提取所以随着网络规模的增大，单纯用 hebb 学习规回导致特征提取越来越难