有机会试用了来自us-central的gpt-4o API,文本生成速度相当快。相比于https://thefastest.ai,这个性能是gpt-4-turbo的5倍TPS,类似于许多llama-3-8b的部署。TTFT:0.34秒Tokens:100(124 tokens/秒)总时间:1.11秒