运行 Cog-5B 需要超过 30 GB 的内存,但由于量化技术,我们可以将其降低到 8-12 GB。此外,使用 `torch.compile` 提高超高速性能!🚀1) 内存高效: https://tinyurl.com/mu85yhk72) torchao 基准测试: https://tinyurl.com/2faxvckf3) quanto 基准测试: https://tinyurl.com/mv2n5kxr