Meta推出了针对大型语言模型生成与归因的最近邻推测解码技术该技术显著提升了多种知识密集型任务的生成质量和归因率,同时实现了1.8倍的推理速度提升https://arxiv.org/abs/2405.19325