【官宣】NVIDIA 周二 TensorRT-LLM 日您知道 TensorRT-LLM 每周二都会有新的主推吗?TensorRT-LLM 为用户提供了易于使用的 Python API 来定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎,以便在 NVIDIA GPU 上高效地执行推理。源代码: https://github.com/NVIDIA/TensorRT-LLM