介绍 - 我们的新AI基准框架,适用于像@Nvidia的H100这样的GPU。测量关键指标,如首次令牌时间、令牌间延迟和令牌吞吐量,用于像Llama2和Llama3这样的LLM。使用BeFOri优化你的AI性能吧!https://t.ly/Q4-oD