Lookahead 是我们创新的 LLM 推理加速框架,实现了无损生成精度。它显著提升了 LLM 的推理速度,达到 2 到 6 倍,设立了性能的新基准。https://github.com/alipay/PainlessInferenceAcceleration