在固定512大小的KV缓存下,LoCoCo还将预训练LLMs的上下文长度扩展到32K 🌟,实现了与对整个序列进行微调相似的性能。Arxiv: https://arxiv.org/pdf/2406.053173/3