Meta Llama-3-70B 和 8B Instruct 模型现已在 DeepInfra 上普遍可用。 这些模型以全 fp16 精度运行,并且性能优于大多数同等规模的模型。我们还将所有 70B 模型的价格下调至每 1M 代币 $0.59 输入/$0.79 输出。https://deepinfra.com/meta-llama/Meta-Llama-3-70B-Instruct