🚀 我们更新了我们的论文!现在展示它可以用于新的大型语言模型,如Llama-2、Falcon、Mistral 和 Mixtral,并且采用W8A8量化,几乎没有损失。如果你想减少大型语言模型服务成本,可以查看我们的论文!📄: https://arxiv.org/pdf/2211.10438.pdf