Flux虽然会按照提示生成内容,但仅靠提示毕竟有其局限性,我总想表达“不是这样的,是这种角度,这种姿势!”这类要求,但不知道怎么实现。最后还是发现自己摆好姿势拍照,然后把照片交给depth的ControlNet是最直接的办法。