YOLO-World + EfficientSAM + Stable Diffusion 能干啥?实时检测视频中的特定对象,然后分割对象,使用自然语言来对特定的对象进行替换、修改、风格化等!是不是很熟悉?科幻片里面的场景就实现了!这意味着你可以对任意图像和视频里面的内容进行实时的替换和修改,甚至换掉视频中的某个人物。作者@skalskip92在线体验:http://huggingface.co/spaces/SkalskiP/YOLO-World